COVID-19を機械学習モデルによって胸部X線やCTから診断・予後予測する研究は、2020年に大量に発表された。しかしケンブリッジ大学を中心とした研究チームは、それら論文にはバイアス・再現性の欠如・不適切なデータセット利用といった理由から、臨床利用に適したものは乏しいと主張している。
ケンブリッジ大学のリリースでは、学術誌 Nature Machine Intelligenceに発表された「COVID-19画像診断の機械学習モデル研究に対するシステマティックレビュー」を紹介している。検索された同領域2,212件の研究論文のうち、タイトルと抄録から415報へ絞り込まれ、フルテキストで抽出された320報のうち、最終的には62報が採用基準を満たしてレビューに含まれた。精査の結論として、これら62報の多くには方法論上の欠陥あるいは根本的なバイアスという共通の落とし穴があり、臨床利用できる可能性が乏しいと研究グループは主張する。欠陥の一例には、機械学習のデータセットとして「非COVID-19群」に子どもの画像を使用し、「COVID-19群」では大人の画像を使用しているといった、大きな偏りが生じている研究もあった。またいわゆる「フランケンシュタイン(つぎはぎ)データセット」というような、複数のデータセットを組み合わせた結果による深刻なデータの重複問題もみられる。
研究チームでは「多くの欠陥が見つかるものの、重要な修正を加えれば、機械学習モデルはパンデミックに立ち向かうための強力なツールになる」と述べて、その潜在的な有効性には十分な期待を示す。「より質の高いデータセット使用」「再現性と外部検証を支える適切なドキュメントの付与」が、機械学習モデルの臨床利用を確立するための必須事項となることは変わらない。