パーキンソン病(PD)の診断は、臨床症状、既往歴、神経学的評価に基づいて行われるが、これらの方法は主観的であり、専門家の判断に依存しているため、診断のばらつきや誤診のリスクが存在する。PDの予測に関する機械学習研究の多くは、音声や歩行パターンなど単一のモダリティに依存している。そこで研究チームは、マルチモーダルなデータセットを用いてPD予測を目的とした機械学習モデルを開発した。
9月5日付で、Current Research in Translational Medicineに発表された論文によると、5つの機械学習モデル(サポートベクターマシン、k近傍法、ロジスティック回帰、ランダムフォレスト、XGBoost)が、Kaggleから得られた多様なデータセット(n=2105)を用いてトレーニングされた。その結果、ランダムフォレストと変数減少法を組み合わせることで、優れたパフォーマンスを達成した(正解率:93%、適合率:93%、再現率:93%、F1スコア:93%、AUC:0.97)。SHAP分析では、UPDRSスコア(パーキンソン病の評価ツール)や機能評価スコアが、LIME分析(Local Interpretable Model-agnostic Explanations)では、運動症状(振戦、固縮、寡動など)や認知機能障害が重要な特徴量として特定された。
上記実験結果は、本モデルが早期パーキンソン病(PD)特定のためのスクリーニングツールとして有用であり、重篤な症状が現れる前にリスク患者を特定できる可能性を示している。研究チームは、「PDの予測精度を向上させるためには、遺伝子バイオマーカーやMRI、DaTscanなどの画像検査データをデータセットに含めるとともに、外部検証を実施して一般化可能性を担保する必要がある」と述べている。
参照論文:
関連記事: