AIモデルは「ショートカット」に依存している?

AIモデルは人間と同様、診断に結びつく近道(ショートカット)を探す傾向があるが、これが誤診や誤った関連の抽出につながる可能性があるという。米ワシントン大学の研究チームはこの知見を論文としてまとめ、今週、Nature Machine Learningから公開した。

本研究論文によるとこの研究チームは、胸部レントゲン画像からCOVID-19を識別するために近年提唱された複数のAIモデルを検証している。対象モデルは、医学的機序に基づく病理学的特性を学びCOVID-19を識別しようとするのではなく、眼前のデータから効率的に識別するためショートカット学習に依存し、医学的には無関係な要因との関連を抽出していることを明らかにした。モデルは臨床的に重要な指標を無視し、各データセットに固有のテキストマーカーや患者位置などの特性さえ優先していたとのこと。

ショートカット学習は医学・病理学的判断に比して堅牢ではないため、別データセットにおいて十分には一般化されない可能性が高い(汎化性能が低い)。同大学の公式ニュースリリースにおいて、筆頭著者であるAlex DeGrave氏は「臨床医は一般的に『AIモデルは疾患特異的な画像パターンからCOVID-19を識別しているはずだ』と考えている。しかし、ショートカットに依存して学習したシステムでは、例えば高齢者の方がより罹患リスクがあるので疾患群だろう、といったように短絡的な根拠に基づく明らかな誤診を導いている可能性がある」とする。

ショートカット学習自体は誤りではなく、完全に除外することは機械学習の利点を奪うことにもなる。ただし、医学領域においてはショートカット学習が示す関連性は「医学的に予期し得ないもの」である可能性があり、透明性の欠如による不適切な診断は大きなリスクを内包していると言える。

関連記事:

  1. 画像検査用AIが誤診を生む? – ケンブリッジ大学の不安定性試験
  2. 熟練医が持つ「違和感」のモデル化 – 正常/異常のみのMRIスクリーニングシステム
  3. COVID-19画像診断の機械学習モデルは臨床レベルに達していない?

前の記事Lucida Medical – 前立腺がんMRI診断AI「Pi」でCEマーク取得
次の記事ニューヨーク大学 – 在宅脳刺激による精神神経疾患の遠隔治療プログラム
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. M.Okamoto MD, MPH, MSc, PhD
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、ロンドン大学ユニバーシティカレッジ(University College London)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員を経て、SBI大学院大学客員准教授、東京大学特任研究員など。専門はメディカルデータサイエンス。

2. T.Sugino MD
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。