希少疾患は患者数が極めて少ないため、臨床経験やデータが不足し、約70%の患者が未診断のまま診断の迷宮に陥っている。従来の機械学習や深層学習は多数のラベル付き症例を前提とするため、希少疾患には適用が困難だった。そこで米ハーバード大学の研究チームは、知識グラフと偽患者データを活用した少数例学習モデル「SHEPHERD」を開発し、npj Digital Medicineでリリースされた。患者の臨床所見と候補遺伝子を入力すると、遺伝子探索、類似患者検索、新規疾患特徴付けを一挙に実行し、未知の疾患にも対応可能な診断支援を目指している。
SHEPHERDはまず疾患・遺伝子・表現型の関係を表現した知識グラフ(知識の地図)を自己教師ありで学習し、その後20万超のシミュレーション患者で微調整。外部評価では、複数の原因不明疾患データベースの計2,042人の実患者に適用し、専門家が絞った真の原因遺伝子候補リストの上位5位を特定する確率が77.8%に達した。さらに、同じ遺伝子が原因の患者同士を自動的に似たグループにまとめたり、新しい病気でも「どの既知の病気に近いか」がわかる形で説明したりできるようになっている。
「SHEPHERDは希少疾患診断における深層学習の壁を突破し、少ない症例でも高精度な支援が可能であることを示した」と著者は述べ、今後は変異レベル情報や動物モデルデータの統合、電子カルテとの連携、臨床ワークフローへの実装評価を進める予定とのこと。AI支援による早期診断が、希少疾患患者の医療負担軽減と治療開始の迅速化に貢献すると期待される。
参照論文:
Few shot learning for phenotype-driven diagnosis of patients with rare genetic diseases
関連記事: