放射線医学や病理学のように画像から診断する分野では、AIによる革命に期待が高まる。しかし一方で、専門家たちはその潜在的な欠点に対して試行錯誤を続けている。
米科学雑誌Scienceでは、そんな医療AIの専門家たちの懸念を紹介している。心臓の画像診断アルゴリズムに取り組むカリフォルニア大学サンディエゴ校の放射線科医Albert Hsiao氏は「ほとんどのAIソフトウェアが単独の病院で設計・検証されているため、別の病院に場所を移しただけで役に立たない危険性がある」と最大の懸念点を語った。
米マウントサイナイ病院の医師Eric Oermann氏は、AIアルゴリズムの欠点を探る研究をしている。彼のチームは肺炎を検出するAIを開発し、マウントサイナイ病院で訓練した。病院の特性は、肺炎の高齢者が多く入院する集中治療室があり、病院のX線画像の34%は肺炎患者のものであった。できあがったAIアルゴリズムを同病院で検証すると93%の肺炎を検出できた。ところが、そのAIを肺炎患者の発生が1%程度であるNIH Clinical CenterとIndiana Network for Patient Careで検証すると、肺炎の検出率は73-80%程度に低下してしまった。
どうしてそのようなことが起きたのか?マウントサイナイ病院では患者の多くがベッドを離れられない健康状態により、ポータブルX線を多用していた。立って撮影するX線とは大きく異なる条件であり、AIアルゴリズムは肺炎をポータブルX線画像と結びつけてしまったのである。Oermannらによる研究成果は2018年にPLOS Medicineに発表され話題となった。
韓国放射線医学会誌で発表された、『516の医療AIアルゴリズムのうち外部データで検証したのがわずか6%』と示した研究は、医療AIを取り巻く現状を実によく表したものである(過去記事)。2019年5月の米国放射線学会では、AIアルゴリズムの開発と検証に、分野・施設をまたいだコラボレーションの強化を求める主張が相次いだ。あなたのX線画像を、どこかで開発されたAIの診断に任せてしまうのは、まだ時期尚早なのだろうか?