AIを医療現場に導入する際、そのAIをどう客観的に評価するか。AI手法が用いられた検査画像の「見栄えの良さ」を評価するような従来の評価アプローチは誤解を招きやすく、臨床現場でのパフォーマンスと矛盾することもある。セントルイス・ワシントン大学の研究チームは「AIによる画像診断手法を客観的に評価するフレームワーク」を提案している。
セントルイス・ワシントン大学のリリースでは、学術誌 PET Clinicsに発表された同研究チームの論文を紹介している(全文はarXiv参照)。画像診断におけるAIの活用例としてPET-CT検査を対象とし、放射性トレーサーの低用量化や撮像時間短縮のためのAI手法などを挙げる。研究チームのフレームワークは、病変の検出や定量といったAIのタスクについて、民族・人種・性別・体重・年齢など条件が異なる患者をテストモデルとすることなどを提案している。このフレームワークは別モダリティの画像検査やタイプの異なるAI手法の評価にも適用可能という。
同論文は、AI研究者と現場の医師がどのようにコラボレーションするか、信頼できるAIの条件として何が優先されるか、課題に取り組む正しいアプローチ法を示唆している。研究チームのひとりで米国国立衛生研究所(NIH)で臨床データ科学担当主任を務めるBabak Saboury医師は「医療は、科学の知恵と最善のツールを用いた、思いやりのケアによる『アート』であることを、自分たちに常に言い聞かせることが必要だ。AIが医療の実践に役立つために重要な課題は信頼性の向上で、そのために本論文では厳密な評価フレームワークを提案した」と述べている。
関連記事: