近年の深層学習技術の発達により、医療画像からの疾患診断AIは急速な発展をみせた。関連する研究報告数もここ数年で加速度的に増えているが、この度「医師とAIの診断精度を比較した論文」を対象としたメタアナリシス(複数の研究報告を統合解析するもので、高いエビデンスを持つ報告とみなされる)が初めて示された。研究成果は学術誌The Lancet Digital Healthにて25日公表された。
EurekAlert!の報道によると、研究チームは2012年から2019年の間に公表された2万を超える関連研究論文を精査したという。しかし、研究デザインをはじめとするアプローチそのものに難があるものがほとんどで、主張を十分に支持するだけの”頑健な”手法に裏打ちされた研究報告はわずか1%に満たなかった。一方、ごく少数の高品質な研究においては、疾患の種類を問わずに「専門医による診断精度とAIによるものに大きな差はみられなかった」とのこと。
かねてより、AI医学研究において妥当性の検証が不十分であることは度々指摘されてきたが(過去記事)、今回の研究チームが行なったレビュープロセスの結果においてもこれに違わない。画像診断AIの潜在的有用性は十分に明らかにされていることから、今後は外的妥当性の検証(アルゴリズムを他集団、特に実臨床現場においても比較検証すること)を重点化することで、将来性の有望な技術の「確かな発展」に繋がるものとなるだろう。