病理組織画像から遺伝子変異などの分子バイオマーカーを推定する人工知能(AI)は、低コストかつ迅速な分子診断の代替として期待されている。しかし本研究チームは、こうしたAIモデルが本当に「分子変化そのもの」を学習しているのかについて疑問を呈し、検証を行った。英国などの研究チームらが、Nature Biomedical Engineeringに発表した。
本研究では、HE染色の全スライド画像を入力として分子バイオマーカーを予測する深層学習モデルを検証した。対象には、がんゲノム解析データベースなど複数の大規模データセットが用いられ、遺伝子変異やDNA修復の異常を示す指標であるマイクロサテライト不安定性など臨床的に重要な指標を予測するモデルが評価された。研究チームは、バイオマーカー間の共存・相互排他関係や臨床病理学的特徴との関連性を統計的に解析し、さらに層別解析や置換検定を用いて、特定のバイオマーカー予測が他の因子の影響を受けていないかを検証した。その結果、多くのモデルでROC曲線下面積(AUROC)などの性能が患者群の条件によって大きく変動することが確認された。解析からは、AIがバイオマーカーそのものを直接識別しているのではなく、腫瘍グレードなどの臨床病理学的特徴や他の遺伝子変化といった「交絡因子」に依存して予測している可能性が示された。これにより予測精度が患者群によって大きく変動し、病理医が既に読み取れる形態情報以上の付加価値が限定的なケースも確認された。
本研究は、病理画像から分子情報を推定するAI研究において、見かけ上の高精度が必ずしも生物学的因果関係を反映していない可能性を示唆する。著者らは、現在の手法を分子検査の完全な代替として用いるのは時期尚早であり、むしろ検査対象のトリアージや補助的判断に慎重に活用するのが現実的と指摘する。今後は、形態学的特徴と分子変化の因果関係を学習できるモデルの開発や、交絡因子の影響を考慮した評価手法の確立が重要になると考えられる。
参照論文:
Confounding factors and biases abound when predicting molecular biomarkers from histological images
関連記事:



















