ラボと実環境の違い – Googleの医療AIが示した課題

Photo by iStock

医学研究において対となる概念 in vitroイン・ビトロ(試験管内)とin vivo イン・ビボ(生体内)がある。人為的に条件を整えられた実験環境のin vitroと、実際の体の中 in vivoでの反応や結果が異なることは科学的視点では基礎中の基礎となる。同様に、実験ラボで極めて高い精度を示したAIが、臨床現場においてうまく機能しない可能性を私たちは忘れてはいけない。

MIT Technology Reviewが報じている、Google Healthの糖尿病性網膜症をスクリーニングするAIが臨床現場で示したエピソードは、大きな示唆に富む。同AIはタイの11の診療所で実証する機会を得た。開発チームが「人間の専門家レベル」と称した90%以上の精度で糖尿病性網膜症を識別し、10分以内に結果を出すシステムは実環境でどう機能したか。うまく機能したときAIは臨床をスピードアップしたが、時に全く結果を出せなかった。看護師が照明の悪い環境で患者の目をスキャンしたところ、画像の5分の1以上がシステムに拒絶された。AIは高い精度を確保するために一定の品質を下回る画像を拒否する設計となっていたのである。またシステムが画像をクラウド上にアップロードする際、一部の診療所ではインターネット接続の悪さが遅延の原因となった。2時間で10人しかスクリーニングできなかったこともあるという。システムから除外された患者にとって、別日に別の場所で専門医の診察を受け直すことは容易ではなく、現場の看護師にとって浪費した時間はフラストレーションとなった。

Google Healthのチームは、地域の医療スタッフと協力して新しいワークフローを再設計しているという。その取り組みは、現場へ真の利益をもたらすAIツールづくりに真摯に向き合った好例となるだろう。他方、現在危惧されるのは世界各地で乱立しているCOVID-19に対応した新しいAIツールである。その発表は性急となっていないだろうか。医療の専門的知見をもたないチームで開発されたAIモデルが現場に混乱をもたらし悪い方向に突進する可能性に私たちは注意しなければならない。AIシステムが、しばしば不確実である医学を拒絶してしまわないよう、精度だけにこだわらない現場への適合を議論すべきだろう。

前の記事電話口で重症度スクリーニング – AIアシスタントによるCOVID-19相談サービス
次の記事量産されるCOVID-19関連論文 – プレプリントについて
TOKYO analytica
TOKYO analyticaは、データサイエンスと臨床医学への深い造詣を武器とし、健康に関するあらゆるモノ・コトのエビデンス構築・普及をお手伝いするメディカルコンサルティングプロジェクトです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. M.Okamoto MD, MPH, MSc, PhD
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、ロンドン大学ユニバーシティカレッジ(University College London)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcherを経て東京大学特任研究員など。専門はメディカルデータサイエンス。

2. T.Sugino MD
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。