呼吸窮迫症候群(ARDS)は、種々の原因で肺に液体が貯留し、血中酸素レベルが急激に低下する重篤な病態を指す。急性呼吸不全に分類されるARDSは、迅速かつ適切な治療介入がなければ患者の多くが死に至るため、発生リスクの正確な推定は患者予後にとって非常に重要となる。米Dascena社と英ケンブリッジ大学などの研究チームは、臨床データからARDSの発生を事前予測する機械学習アルゴリズムを構築した。
ピアレビューの医学誌・The Journal of Critical Careにてオンライン公開されたチームの研究論文によると、9,919名の患者データベースをレトロスペクティブに解析し、本アルゴリズムを導いたという。個々の臨床所見や画像所見を代表する種々の数値情報から、ARDS発症の12-48時間前での高精度なリスク予測を実現した。
機械学習モデルにはGradient Tree Boostingを用いているが、これは複数の弱学習器から予測結果を統合して強学習器を導くいわゆる「アンサンブル学習」の1つで、近年ではKaggleなどの機械学習コンペでも頻用されている。電子カルテシステムへの実装によって、ARDSのハイリスクを早期に自動同定する本アルゴリズムは、特に重症患者を多く扱う高次医療の現場において需要が大きい。