乳がん検診における乳房X線検査(マンモグラフィ)では、AIによるスクリーニングへの期待が高まっている。では、検診において「人間の読影をAIに置き換えるのに足る十分なエビデンス」があるか。英国政府の検診検討委員会(UK National Screening Committee)がウォーリック大学に委託したレビューの結果がこのほど、学術誌 BMJから発表された。
同研究の結論から言うと、乳がん検診におけるAIは「現時点で、臨床現場への導入に必要な質は全く担保されていない」というものだ。レビューには、2010年以降に発表された12件の研究、計131,822人のスクリーニング検査が含まれる。その中で評価された36件のAIシステムのうち、34件は放射線科読影医1人よりも精度が低く、36件全てが読影医2名によるダブルチェックよりも精度が低かった。小規模な研究で有望とされた結果でも、大規模な検証では再現されていないという結論が示されている。
アルゴリズムには常に改良が加えられるため、過去に報告されたAIシステムは研究発表の時点で既に古くなっている可能性もある、と著者らは考察する。しかし、今回のレビューには厳格な研究の組み入れ基準を用い、質を体系的に評価していることから、「AIが乳がんスクリーニングで読影医のダブルチェックを置き換えるだけのエビデンスは現状不十分」という結論は強固なものと主張している。その上で「AIが読影医と競合するのではなく、読影医を補完することでスクリーニングのあり方を再設計する」ことが将来的に有望であるとする。
関連記事: