うつ病は世界的に増加している。自然言語処理(NLP)と機械学習(ML)を用いたうつ病検出は近年多く開発されているが、全体的な精度や、臨床下で実際使用できるかどうかは不確かである。こうした中、米国の研究チームは、NLPとMLを用いて話し言葉や書き言葉からうつ病を自動検出する研究の系統的レビューとメタ解析を実施し、npj Digital Medicineに発表した。
研究では6つの電子データベースなどから抽出した123研究を対象とし、代表的な131モデルのうち独立した43データセットである計4万983件のテキストを統合解析した。主解析の正確度は0.80(95%CI 0.76–0.83)で、AUCは0.79、適合率0.78、再現率0.76、バランス精度0.71であった。あらかじめ定められた質問が提示される構造化臨床面接では精度0.84と最も高く、自由記述やセラピー会話では低下した。特徴量では辞書ベースの言語特徴が0.86と高く、従来型分類器とトランスフォーマー型は同程度(いずれも0.81)であった。一方で研究間のばらつきは大きく、応用には慎重な解釈が必要とされた。
今回の研究は、言語データに基づくうつ病検出が一定の性能を持つ一方、データ特性や評価指標により結果が大きく左右されることを示している。著者らは、「これらの手法は診断の代替ではなく意思決定支援として位置付けるべき」と述べている。今後は感度・特異度を含む標準化された報告や、多様な言語・集団での外部検証が進むことで、スクリーニングや継続的モニタリングへの応用が期待される。
参照論文:
Language-based detection of depression with machine learning: systematic review and meta-analysis
関連記事:



















