医療画像データセットでの性別不均衡がAI診断能力を低下させる

AIアルゴリズムに人種差や性差などの偏りが入り込むことで、適性な働きができなくなる可能性は広く指摘されてきた。米国科学アカデミー紀要(PNAS)において、医療画像データセットで性差のバランスが満たされていない場合にも、AI画像診断の能力が低下することを示した研究成果が発表された。

26日に公開された同研究では、米国立衛生研究所(NIH)およびスタンフォード大学で管理されている数万人規模の胸部X線画像データセット2種類を対象としている。もともとこれらのデータセットではNIH版が男性56.5%、スタンフォード大学版が男性60%であり、通常の環境下ではその性別の偏りはあまり問題視されてこなかったという。しかし今回の研究で、男性:女性の画像データ比率を研究用に組み換えて検証を行ったところ、「男性比率が高いデータセット」でトレーニングしたAIアルゴリズムを女性に適用させた場合、診断能力が明確に低下することが確認された。

性差などのバイアスがAIアルゴリズムに入り込んだ際、どのような不具合を引き起こすかについて本研究は貴重な教訓となる。データセットの多様性については、我々が想定する以上にその影響を考慮しなければいけない。まず重要な一歩として、データセットの限界について認識することが必要であろう。

前の記事モバイルメッセージングプラットフォームのNetSfere – 医学用語の音声認識に対応へ
次の記事法医学領域における年齢予測のためのエピジェネティックモデル
TOKYO analytica
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. M.Okamoto MD, MPH, MSc, PhD
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、ロンドン大学ユニバーシティカレッジ(University College London)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員を経て、東京大学特任研究員など。専門はメディカルデータサイエンス。

2. T.Sugino MD
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。