胸水はさまざまな疾患によって引き起こされる可能性があり、その鑑別は多岐にわたる。胸水の原因疾患を特定するための機械学習モデルが開発されているが、大半のモデルでは10個以上の特徴量の入力が必要であり、これが検査費用の増加につながっている。中国の研究チームは、年齢、胸水ADA、胸水LDHを用いて、胸水の鑑別を行う機械学習モデルを開発した。
Respiratory Researchから発表された研究論文によると、研究チームは2014年から2024年までに胸水検査を受けた入院患者742名(癌性胸水53.3%、結核性胸水34.1%、肺炎随伴性胸水4.2%、漏出性胸水4.4%、その他3.8%)を解析に含め、6つの機械学習モデルを訓練した。その結果、癌性胸水の診断においてXGBoostとランダムフォレストが0.890を超えるF1スコアを達成し、結核性胸水の診断においては、k近傍法が0.870以上のF1スコアを示し優れたパフォーマンスを発揮した。また、癌性胸水、結核性胸水、漏出性胸水の分類に関しては、すべてのモデルでAUCが0.890以上を示し、従来のカットオフ法と比較して優れた結果となった。一方で、肺炎随伴性胸水は他の胸水と比べるとやや分類が難しく,AUCは約0.70であった。特徴量としては、年齢、ADA、LDHが用いられ、ADAが診断上最も重要であることが明らかになった。
本機械学習モデルにより、3つのパラメータのみで胸水の原因疾患を特定できる可能性が示された。研究者らは、「予測能力を向上させるためには、さらに大規模かつ多様なデータセットにおいてモデルの検証が必要である」と述べている。
参照論文:
関連記事: