医療とAIのニュース 2025
年間アーカイブ 2025
癒着性小腸閉塞の手術適応を識別するAI
癒着性小腸閉塞は、腸管の癒着によって生じる閉塞性疾患であり、一部症例では腸管の壊死が進行し手術が不可欠となる。CT画像は診断の重要な手段とされるが、壊死の早期識別には限界がある。こうした課題を踏まえ、中国・青島大学の研究チームは、癒着性小腸閉塞における手術適応を予測する機械学習モデルを開発した。
今月発表された研究論文によると、チームは2019年から2022年に収集した188例のCT画像データを用い、トレーニング(n=131)とテスト(n=57)の2つのコホートに分け、臨床指標や血液検査値、CT画像の特徴を収集した。白血球数、閉塞時間、感染徴候(発熱、頻脈、腹膜炎)、およびCT所見(腸管壁の肥厚、腹水、腸間膜脂肪のHigh densityなど)を組み合わせた予測モデルを作成し、手術適応の予測精度を評価した。結果、テストコホートでのAUC(曲線下面積)は0.761(95% CI、 0.628–0.893)を記録し、従来のCT所見や血液検査のみでは識別が難しかった腸管虚血の検出精度を向上させる結果となった。
本研究成果は、癒着性小腸閉塞の手術適応予測の精度向上だけでなく、不要な外科的介入の抑制にも寄与し得る点で意義が大きい。特に、診療リソースの逼迫が課題となる医療現場において、CT画像を活用した客観的な評価手法の導入は、臨床判断の均一化と効率化に貢献すると期待される。
参照論文:
Development and validation of a CT-based radiomic nomogram for predicting surgical resection risk in patients with adhesive small bowel obstruction
関連記事:
腹部ヘルニア手術後の有害転帰を高精度に予測
UCLA「MOVER」 –...
脳出血後の血腫拡大をAIで予測する試み
非外傷性脳出血(ICH)後に血腫拡大が見られる患者は、しばしば不良な経過を辿るため、予防的な治療介入が必要となる。一方、画像検査の視覚的特徴等を基に臨床医が血腫拡大を推測することは難しく、予測モデルの研究深化が望まれている。このたび米ニューヨーク大学の研究チームは、機械学習モデルが専門医の予測精度を上回ったとの研究成果をNeurocritical Care誌に発表した。
同研究では、高血圧性急性脳出血の第2相試験(ATACH-2)に参加した900人のICH患者のデータを用いて、機械学習モデルの教師あり学習を行った。そして独立したテストコホート(n=279)で、血腫拡大(24時間以内の33%以上、または6mL以上の拡大と定義)の予測性能を評価し、また専門医による予測精度との比較を行った。モデルは、CT画像のみで学習を行ったトランスフォーマーモデル(DLモデル)と、CT画像と臨床データで学習したランダムフォレストモデル(RFモデル)の2種類を用いた。その結果、専門医による血腫拡大予測のAUCが0.591なのに対し、DLモデルのAUCは0.680、RFモデルのAUCは0.677と、臨床医を上回る予測精度が得られた。
著者らは「本モデルのAUCは必ずしも高いとは言えないが、専門医による予測がそれ以上に困難であることを踏まえると、補助的に活用できる余地はあるだろう」と述べている。今後は、多様な出血性素因を持つ大規模な集団における厳密な検証が望まれている。
参照論文:
Predicting hematoma expansion after intracerebral hemorrhage: a comparison of clinician prediction with deep learning radiomics models
関連記事:
重篤な脳損傷患者の回復を予測するAI
機械学習による脳腫瘍の悪性度判定
CTスキャンから「MRI品質の脳画像」を提供
造影MRI画像から末梢動脈疾患を識別するAI
従来の画像を用いた末梢動脈疾患(PAD)診断は主に大血管の狭窄を評価するものであり、微小血管の血流障害を定量的に評価する方法は確立されていなかった。このほど、米ペンシルバニア州立大学やヒューストン・メソジスト病院、ベイラー医科大学などの合同研究チームは、造影磁気共鳴画像(CE-MRI)と機械学習を組み合わせたPADの新たな診断手法を発表した。本成果はNatureの関連誌であるScientific Reportsで公開されている。
同研究では、56名の参加者(PAD患者36名、対照群20名)の下腿筋のCE-MRIデータを分析し、PAD患者の微小血管障害を明確に可視化した。 造影剤を用いたMRI撮像後、時間経過による各筋群の信号強度変化を追跡し、各画素を過灌流、正常灌流、低灌流に分類した。このデータを基に機械学習の決定木分類器を訓練した結果、PAD患者と対照群を87.6%のF1スコアで識別できた。また、低灌流領域の割合を用いることで、運動能力が低いPAD患者や糖尿病を合併するPAD患者をそれぞれ67.6%、70.3%の精度で識別可能であった。
研究チームは「本手法は、非侵襲的に微小血管の灌流障害を評価できることが大きな利点だ。また、従来の診断法では把握しにくいPADの進行度や患者ごとのリスク評価に貢献できる可能性がある」と述べている。今後は、大規模データを用いたモデルの精度向上と、臨床応用に向けたシステム開発を進める予定だ。
参照論文:
Contrast-enhanced magnetic resonance imaging based calf muscle perfusion and machine learning in peripheral artery disease
関連記事:
CTから冠動脈の血流低下を予測するAI
腹部大動脈瘤検出AI「Viz Aortic」 – 米国病院で初採用
心臓造影MRIから突然死のリスクと発生タイミングを予測するAI研究
無下剤バーチャル内視鏡検査システムを開発するBoston Medical Sciences、計9.3億円を追加調達
Boston Medical Sciences株式会社(本社:東京都中央区、代表取締役:岡本将輝)は、既存投資家であるBeyond Next Ventures株式会社に加え、JICベンチャー・グロース・インベストメンツ株式会社、グローバル・ブレイン株式会社、明治安田生命保険相互会社(明治安田未来共創ファンド)、東日本旅客鉄道株式会社を主たる有限責任組合員とする高輪地球益ファンド、三菱UFJキャピタル株式会社、株式会社ユカリア、株式会社地域ヘルスケア連携基盤を新規投資家として迎え、シリーズAラウンド(プレシリーズAラウンドを含む)にて9.3億円の資金調達を実施した。
ハーバード大学医学部、およびマサチューセッツ総合病院で教員・研究者を務める医師が2023年4月に設立した同社は、AIの研究開発と医療画像解析、臨床医学への強力な技術・経験をバックグラウンドとして、「下剤不要のバーチャル内視鏡検査システム」である「AIM4CRC」を世界で初めて、日本から臨床実装することを目指している。今回の調達資金は、研究開発体制のさらなる強化、目前に控える国内治験の実施、日本・米国の薬事対応、および市場展開を見据えた体制拡充、に充てられる。
これまで同社は、国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)の「ディープテックスタートアップ支援事業」や、厚生労働省の「プログラム医療機器に係る優先的な審査(優先SaMD)」、米Mayo Clinicと日本貿易振興機構(ジェトロ)が提供する「HealthTech Gateway "AI Medical in the US"」に採択されるなど、加速度的な成長を遂げてきた。「誰一人、大腸がんで亡くならない世界」を実現するため、Boston Medical Sciencesは次のステージに進む。
乳腺組織の老化関連核形態と乳がんリスク – AIによる評価
これまでの乳がん研究では、細胞老化が腫瘍抑制と促進の両面で関与することが示唆されていたが、健康な乳腺組織における老化細胞の分布が将来の乳がん発症リスクに影響を与えるかどうかは不明だった。米インディアナ大学の研究チームはこのほど、健康な女性の乳腺組織切片画像から細胞老化を検出・解析する深層学習モデルを開発し、その結果、老化の種類によって乳がんの発症リスクが増減するこのを明らかにした。研究成果は、The Lancet Digital Healthからオンライン公開されている。
研究では、米インディアナ大学のKomen Tissue Bankに登録された4,382人の健康な女性の乳腺組織切片を対象に、細胞老化の空間的分布と乳がん発症リスクの関係を調査した。これらの画像から3,200万個以上の細胞核を解析し、異なる老化誘導因子(放射線照射、複製疲労、薬剤処理)に基づく3種類の老化モデル(IR、RS、AADモデル)を適用した。その結果、乳がん発症群と非発症群で細胞老化のパターンに有意な違いが認められ、特に脂肪組織における薬剤誘導型老化細胞(AADモデル)の割合が高い場合は乳がんリスクが低下し、逆に放射線誘導型老化細胞(IRモデル)が高い場合は乳がんリスクが上昇することが示された。また、従来の乳がんリスク評価指標であるGailスコアと組み合わせることで、より精度の高いリスク評価が可能であることが明らかになった。
研究者らは「老化細胞の種類ごとに乳がん発症リスクが異なる点を強調し、AIを活用した細胞老化の解析は非悪性乳腺生検の臨床的有用性を高める可能性がある」と述べている。将来的には、老化関連バイオマーカーの標準化や、他のがん種への応用も期待される。
参照論文:
Deep learning assessment of senescence-associated nuclear morphologies in mammary tissue from healthy female donors to predict future risk of...
日常診療の超音波検査から心筋症の早期発見を行うAI
患者状態を把握するための超音波検査(Point-of-care ultrasonography:POCUS)は日々診療現場で行われているが、得られたデータの活用が進んでいない現状がある。このほど米イェール大学の研究チームは、POCUS動画を元に心筋症のスクリーニングを行う高性能なAIモデルに関する研究成果を発表した。
Lancet Digital Healthに掲載された同研究では、290,245本のPOCUS動画を用いて、畳み込みニューラルネットワークの学習を行った。各動画について「肥大型心筋症」「トランスサイレチン型アミロイドーシスによる心筋症(ATTR-CMによる心筋症)」の判別を行うタスクを行わせた結果、肥大型心筋症についてAUROCが0.903、ATTR-CMによる心筋症についてAUROCが0.907という高い精度を示した。また、肥大型心筋症患者の58%、ATTR-CMによる心筋症患者の46%が、確定診断の約2年前時点での動画で、同モデルによりスクリーニング陽性と判定されることが分かった。また、心筋症の診断が無い患者の追跡調査を行ったところ、同モデルで心筋症の確率が高いと示された患者群で有意に死亡リスクが高いことが示された。
研究チームは「AIモデルを用いて臨床診断の数年前から疾患を検出することで、治療可能な心筋症に早期介入することが可能になるだろう。これからは患者の層別化にも活用したい」と述べている。今後は前向き研究での検証を通じて、臨床現場での有効性が高まることが期待される。
参照論文:Artificial intelligence-guided detection of under-recognised cardiomyopathies on point-of-care cardiac ultrasonography: a multicentre study
関連記事:1.AIによる心エコー初期評価2.AI心電図 – リスク患者の特定により院内死亡を大幅に低減3.AIが「心臓突然死の予知・予防」に役立つ可能性
緑内障診断の最前線—機械学習モデルが重症度を見極める
今までの光干渉断層計(OCT)画像を用いた緑内障の診断AIでは、緑内障の重症度を分類するものは無く、また各特徴量の重要度を示すモデルは存在しなかった。このほど、豪ニューサウスウェールズ大学の研究チームは、緑内障診断と重症度分類が可能な高精度の機械学習モデルを発表した。本成果はScientific Reportsで公開されている。
同研究では、健常者334例と緑内障268例(重症度別:初期86例、中期72例、後期110例)のOCT画像を用意し、網膜領域(網膜神経線維層(RNFL)、網状層および黄斑)の分布・厚さなどの空間的特徴に加え、RNFLに対し周波数解析を施した特徴量を用いて、重症度分類の教師あり学習を行った。複数の機械学習モデルを比較した結果、サポートベクターマシンの精度が最も高く(AUC値0.97)、特に初期および中期の緑内障診断において医師の精度を上回っていた。また、SHAP分析から「RNFLの対称性」「RNFL下層の厚さ」が緑内障診断に重要な特徴量であることが示唆された。さらに本研究チームは、臨床現場で利用可能なアプリの開発も行っている。
著者らは「医師の診断がばらつきやすい初期の緑内障を検出できることは、本モデルの優れた点である。また、従来の深層学習と異なり、機械学習によって特徴量の説明可能性が上がったことは診断支援において価値がある」と述べている。今後は、年齢や眼圧等の特徴量を考慮しモデルの精度を高めると共に、アプリをOCT検査機器に組み込むことを目指すとしている。
参照論文:OCT-based diagnosis of glaucoma and glaucoma stages using explainable machine learning
関連記事:1. AIは糖尿病性眼疾患の進行を予測できるか?2.「眼の老化」を測定3. 網膜眼底画像によるパーキンソン病スクリーニング
胎児心拍数陣痛図から胎児アシドーシスを予測するAI
胎児心拍数陣痛図(EFM)は、胎児の状態をリアルタイムに評価する検査であり、分娩介入への有効性が示されてきた一方、その波形から分娩時低酸素状態の予防に繋げることは困難であった。このほど、米ペンシルベニア大学・ハーバード大学の共同研究チームは、胎児心拍数陣痛図データから、高い精度で胎児アシドーシスを予測するディープラーニングモデルを発表した。
AJOG(米国産婦人科学会誌)に掲載された同研究では、欠損データが30%未満かつ分娩前60分間のデータが存在し、臍帯動脈血pHとの対応が取れる10,182件のEFMデータを用いた。複数のモデルに教師あり学習を行い、「pH値が7.05/7.10/7.15/7.20未満であるか」を予測させた結果、時系列データ分類に特化したInceptionTimeモデルが最も高い精度を示した。特に、pH値<7.05の予測ではAUROCが0.85、pH値<7.10の予測ではAUROCが0.83であった。また、「Base Excessが-10meq/L未満」を予測項目に追加すると、いずれのpH値への予測でもAUROCが0.85を超える結果となった。外部検証ではAUROCが0.72という結果を得ている。
研究チームは「従来の視覚的な解釈や既存のソフトでは、EFMデータを十分に活かせていなかったが、深層学習によりEFMの解釈性を高めることが可能となった。今後は、本モデルがより有効となる患者特性を探りたい」と述べている。また、EFM分析では、局所の非線形的な特徴も考慮できるモデルが有用であることが示された。本技術が現場で活用されることで、分娩ケアのより一層の向上が望まれる。
参照論文:Intrapartum electronic fetal heart rate monitoring to predict acidemia at birth with the use of deep learning
関連記事:1. ディープラーニングモデルが心房細動を正確に予測2. 心エコー・電子カルテ情報から心室中隔欠損の自然閉鎖を予測3. 分娩中にリアルタイムでリスク予測
医療従事者のAIに対する認識:横断的調査
オーストラリアのクイーンズランド州において、「医療従事者のAIに対する認識と、医療現場におけるAI使用の機会や課題」について、横断的調査が行われた。
本調査は、231名の医療従事者を対象に行われ、医療従事者のAIの認識に関する調査を目的に開発されたShinners Artificial Intelligence Perception toolが用いられた。参加者の大半は40歳未満(67.9%)であり、平均勤務経験年数は10年であった。大半はAIの使用経験がなく(80.1%)、医療にAIを導入する上での課題に、「知識不足」が挙げられた。また、大半が「AI実用化に対する準備ができていない」と感じており、AIにより重要なタスクが奪われることを懸念していた。ほとんどの参加者はAIに関する教育を受けていないが(82.3%)、トレーニングを希望しており(73.6%)、AIが医療を改善すると回答した。薬剤師が、「AIの導入が実務に影響を与える」と考える傾向が最も強く、理学療法士とソーシャルワーカーが考えにくいとする傾向がみられた。AI活用の機会に関する自由記述の回答では、勤務表作成、患者モニタリング、投薬管理、職場におけるトレーニングや患者教育、職場のワークフローの作成・効率化などが挙げられた。
筆者らは「AIにより受けられる恩恵は、デジタルリテラシーの高い職種に限定されるべきではない」としており、職場トレーニングなどにおけるAI教育の重要性を強調した。また、医療においてAIを有効に利用する機会について検討するために、AI業界の専門家との協力の必要性も指摘した。
参照論文:
Allied Health Professionals' Perceptions of Artificial Intelligence in the Clinical Setting: Cross-Sectional Survey
関連論文:
AIに対する放射線技師の理解度調査
ネパールの医学生における「AIへの意識」
世界の精神科医たちは医療AIを強く疑っている? – SERMOの国際意識調査から
AI医療利用の世界ランキング – 日本は調査対象外
ポリソムノグラフィーから睡眠段階を分類するAI
睡眠の質を評価し、関連する健康リスクを低減するには、睡眠段階を正確に分類することが重要となる。 しかし、従来のポリソムノグラフィー(PSG)解析では、多数の生理信号(EEG、EOG、EMGなど)を用いて専門技術者が手作業で分類を行うため、多大な時間と労力が必要であり、判定者間のばらつきも課題とされてきた。
韓国の研究チームは、睡眠段階分類に特化した機械学習モデル「SleepXViT」を開発し、その成果をNatureの関連誌であるnpj Digital Medicineで発表した。このモデルは、PSG信号画像を用い、Vision Transformer(ViT)をベースにした2段階構造を採用している。1つ目は単一の画像(30秒間のPSG信号画像)から特徴を抽出する「Intra-epoch ViT」、2つ目は連続した複数の画像を解析し、時間的文脈を考慮する「Inter-epoch ViT」で構成される。大規模なKISSデータセット(7,745件)やSHHSデータセットを活用した結果、SleepXViTは分類精度(MacroF1スコア:81.94)で従来モデルを上回る成果を示した。さらに、各分類結果の信頼度を示すConfidenceスコアや、分類に影響を与えた特徴領域を可視化するヒートマップを提供することで、臨床現場での実用性を高めている。
著者らは「SleepXViTは高精度な分類能力に加え、結果の透明性と解釈性を兼ね備えており、臨床医の補助ツールとして有用である」と述べている。また、将来的には、多施設からのデータ収集やモデル改良を通じて汎用性を高め、睡眠医療全体の質を向上させる可能性が期待される。
参照論文:
Explainable vision transformer for automatic visual sleep staging on multimodal PSG signals
関連記事:
HoneyNaps「SOMNUM」 – 睡眠障害解析AIでFDA承認
「睡眠障害の危険因子特定」へのAI利用
生理信号とハイブリッド学習に基づく睡眠障害検出
剖検脳MRI画像から海馬亜領域を判別するAI
アルツハイマー型認知症などの加齢進行性疾患は、脳の神経細胞の脱落が原因となる疾患である。こうした脳疾患の病態解明には、疾患の最終像となる脳を用いた研究が欠かせない。特に認知症の病態と関係する海馬領域の解析は示唆に富むが、人手と時間を要する現状がある。これに対し、米テキサス大学の研究チームは、剖検脳MRI画像から、海馬およびその亜領域を高い精度で自動判別するディープラーニングモデルを発表した。
神経科学研究の手法を取り扱うNeuroscience Methodsに掲載された同研究では、神経変性疾患患者における15の剖検脳MRI画像(T1強調像・T2強調像・SWI(T2*強調像と類似))を用いて、畳み込みニューラルネットワーク(CNN)モデル「DeepAIM」の教師あり学習を行った。DeepAIMは、CNN構造を元にしたU-netにAttention機構を導入したもので、同U-netを用いた4つの先行研究と比較し、海馬、海馬亜領域(歯状回、海馬頭部、海馬体部、海馬尾部)の判定において最も優れた精度を示した。また、SWI画像を含むマルチモーダルなMRI画像を学習に用いることが、高い精度に繋がることも明らかとなった。
研究チームは「従来の病理組織学的手法と組み合わせることで、神経画像研究は未だ発展の余地がある。機械学習などの技術を掛け合わせることで、海馬研究を加速させたい」と述べている。今後は、より大規模なデータへの適用や、モデル構造の改良による学習効率の向上が期待されている。
参照論文:
Convolutional Neural Networks for the segmentation of hippocampal structures in postmortem MRI scans
関連記事:
「一度の脳スキャン」でアルツハイマー病を高精度に診断
認知症の脳萎縮パターンを検出するAI研究
電子カルテから発症5年前にアルツハイマー病を予測
非専門医による肺エコー検査、AIガイド下で精度向上
近年、救急や在宅医療の現場で、肺エコー検査が注目されている。気胸や肺水腫などの診断に肺エコーが有用とされる一方で、質の高い画像を得るには熟練した技術が必要なことが課題であった。この課題に対し、米イェール大学の研究チームは、 AI支援システムを導入することで、非専門医が専門医と同等の精度で肺エコー検査を行えるとの研究結果を発表した。本成果はJAMA Cardiologyに掲載されている。
同研究では、臨床的に肺水腫の存在が疑われる21歳以上の患者176名を対象に、各患者に「非専門医(内科医、看護師、医療助手など)+AI支援システム」と「エコー専門医」がそれぞれ検査を施行し、取得画像の検討を行った。AI支援システムは、画像を自動でセグメンテーションし、Bライン(肺水腫や肺炎などで見られるアーチファクト)を同定する機能を持つ。検査方式を伏せた状態で、各画像が診断に資する描出精度であるかという観点から5名の専門家が評価した結果、非専門医によるエコー画像の98.3%が、専門医による検査と同等の精度であると判定された。非専門医の職種(医師と非医師)によるサブグループ解析においても、描出精度の判定に統計的な有意差は認められず、非医師でも同等の精度で肺エコー検査を行える可能性が示唆された。また、特定の領域(左前胸部)においては、AIガイド下の方がより精度の高い画像を描出することが可能であった。
著者らは、今後の展望について「胸水、浸潤影、胸膜病変を検知するAIアルゴリズムの研究に取り組み、更なる精度向上に努めたい」と述べている。こうしたAI支援システムは、医学教育の現場において活用されることも望まれるだろう。
参照論文:Artificial Intelligence–Guided Lung Ultrasound by Nonexperts
関連記事:1. AIによる心エコー初期評価2. 心エコーAIがソノグラファーを上回る3. AIが「MRIにおける前立腺がん検出」を支援
AIを用いた転移性脊椎腫瘍と脊椎圧迫骨折のMRIによる鑑別
脊椎圧迫骨折は加齢とともに発症率が高まる比較的一般的な疾患である一方、転移性脊椎腫瘍(MSC:Metastatic Spine Cancer)は治療が遅れると腫瘍が脊髄を圧迫し、両麻痺などの合併症を引き起こし得る重篤な病態である。よって、これらの疾患の区別は重要であるが、MRI画像上による鑑別は困難なことがあり、誤診率は17%にも上る。韓国の研究チームは、脊椎圧迫骨折と転移性脊椎腫瘍をMRIで区別するAIモデルを開発し、Bioengineeringに掲載した。2019年から2022年までに、胸部MRI検査を受けた248人の患者の画像が、MSC患者135名と転移性病変のない患者(Non-metastasis:NSC)113名に分類された。データセットは、MSC、MSC圧迫骨折、NSC、NSC圧迫骨折の4つで構成され、これらの画像は、大津の二値化法とCannyエッジ検出により前処理された。チームは、畳み込みニューラルネットワーク(CNN)モデルとサポートベクターマシン(SVM)モデルを構築し、評価した結果、T1強調画像において、CNN、SVM両方で高い正解率(0.982/0.971)と感度(1.000/0.978)を示した。また、大津の二値化法とCannyエッジ検出の画像の前処理が、機械学習モデルの予測精度を向上させることも示している。筆者らは「本研究で開発したモデルは、特にMSCに対して優れた感度を示しており、将来的にMSCの診断に役立てられる可能性がある」と述べている。今後は、多様な画像処理技術やモデルを適応し、より精度の高いモデルの構築や非転移性圧迫骨折を検出することを目指すとしている。参照論文:The Classification of Metastatic Spine Cancer and Spinal Compression Fractures by Using CNN and SVM Techniques関連記事:1. 小さな舟状骨の隠れた骨折をX線画像から識別するAI研究2. 日常診療の画像読影パフォーマンスを向上させる骨折検出AI3. 「AIの精度差」が放射線科医のパフォーマンスに影響
機械学習による肺塞栓症の予測
肺塞栓症(PE)は、迅速な診断と治療が求められる致命的な疾患であるが、多彩な臨床像を呈するため診断の見逃しや誤診、治療介入の遅れにつながることがある。中国の研究チームは、機械学習アルゴリズム(MLA)を構築し、その予測能力を検証した結果を、2025年1月4日、Scientific Reportsに公表した。2015年から2020年の間に入院したPE疑いの患者1480人が後ろ向きに解析された。研究チームは、患者属性や画像を含む各種検査結果から、Lassoモデルと多変量ロジスティック回帰を用いて特に重要なPE予測因子を特定し(Dダイマー、APTT、FFDP、血小板数、アルブミン、コレステロール、ナトリウム)、これらを入力変数として複数のMLAモデルを構築した。ロジスティック回帰、ランダムフォレスト、サポートベクターマシン、多層パーセプトロンなどのMLAを構築・評価した結果、ランダムフォレストが最も高い予測精度を示した(AUC=0.776)。さらに、SHAP解析により、各変数が予測に与える具体的な影響を可視化し、これらの結果をもとにPEリスク評価のためのオンラインツールを開発した。筆者らは、「ウェルズ基準やジュネーブスコアなどの従来のPE予測スコアリングと異なり、MLAによる予測では、臨床医が個々の患者ごとにデータを検討する必要がなく、患者集団を幅広く一度にスクリーニングすることができる」と述べている。さらに今後は、非血栓性PEについて、原因に応じたPE予測モデルの構築を目指す、と意欲をみせている。参照論文:Prediction of pulmonary embolism by an explainable machine learning approach in the real world関連記事:1. 肺塞栓症のAI画像診断を改善 – AidocとImbioのシステム統合2. 心電図を活用して肺塞栓症を検出するAI研究3. 非専門家のための深部静脈血栓症の診断AIツール「AutoDVT」
救急医療に応用可能なAI製品 – FDAリストのレビュー
救急医は、不確実性の高い状況下において限られた情報をもとに、重要な判断を下さなければならないが、AIを利用した製品は、トリアージや診断、臨床転機の予測などについて、救急医療(Emergency Medicine:EM)における意思決定をサポートできる可能性がある。米国では、AIを利用した製品の一部は、FDAにより承認を受ける必要がある。米Mayo Clinicの救急医らは、FDAにより公表されているAI利用製品リストのレビューを行い、EMに応用可能な製品を特定し、評価した。
1995年から2024年までに、合計882のAI利用製品がFDAによって審査され、そのうちEMに適用可能な製品は154であった。EMで有益なAI利用製品の大半が、診断、画像解析(X線、CT、超音波、MRI)に関連するものであった。その他には、聴診器で聴取される心音や呼吸音の解析、脳波の解析による痙攣や外傷性脳挫傷の特定、眼振の解析による脳震盪の評価などに関連する製品が見られた。一方で、臨床的意思決定支援や治療に直接貢献する製品はほとんど見られなかった。ICER(臨床経済評価研究所)の評価基準に基づき、製品の健康的利益を評価した結果、肯定的な利益が期待される製品は全体の20%(30製品)にとどまり、79製品(51%)では元来の基準と比較したエビデンスが不足していることが判明した。
筆者らは、今後数年間でこれらのAI利用製品の導入は大幅に増加すると予想しており、これに先立ち、製品の安全性と臨床的有効性を評価するためのガイドラインとプロセスを明確化することが重要であると述べている。
参照論文:
FDA reviewed artificial intelligence-enabled products applicable to emergency medicine
関連記事:
救急部における画像解析AI利用の価値
救急部の胸部X線読影における生成AIの可能性
ChatGPT – 救急外来の鑑別診断で医師と同等のパフォーマンス
機械学習による肝硬変の死亡率予測に関する評価:システマティックレビュー
肝硬変の評価ツールとして、Child-Pugh分類やMELDスコアなどが知られているが、死亡率の予測については限界がある。米ニューヨークに所在するRochester General Hospitalなどの研究チームは、「機械学習よる末期肝硬変患者の死亡率予測」について系統的レビューを行い、Journal of Medical Artificial Intelligenceより発表した。
研究チームは、「機械学習による末期肝硬変の死亡率予測」に関連する2024年4月までの論文につき、PubMed、CINAHL、Ovid、Springer、Cochraneのデータベースを検索し、基準を満たす10件の後ろ向き研究のレビューを行った。モデルに関しては、ロジスティック回帰(LASSOによる正則化を含む)、ランダムフォレスト、ブースティング系(勾配ブースティングおよびAdaBoostなど)がそれぞれ5件、人工ニューラルネットワーク(ANN)/ディープラーニング系が4件あり、その多くが従来モデルを上回る予測性能を示していた。例えばANNを使用したモデルのうちの1つでは、従来のMELDスコアのAUROC(0.86)を超える0.96を達成している。また、利用されたデータセットには、患者の年齢や性別、肝疾患の病因、臨床検査値など多岐にわたるパラメータが含まれており、従来モデルの4〜5項目に比べて多様な情報を活用していることが特徴的で、より多くのパラメータを用いたモデルにて、優れた死亡率予測精度が得られていた。
筆者らは、「末期肝硬変の死亡率を予測する機械学習モデルを臨床現場に導入するためには、複数のデータセットによりモデルの検証を行う必要がある」としている。さらに、コードやデータを共有し、ピアレビューによる評価を行うことも重要であるとコメントしている。
参照論文:
Evaluating the predictive power of machine learning in cirrhosis mortality: a systematic review
関連記事:
肝移植後の短期死亡率予測モデル
肺がん死を高精度に予測する個別化リスクモデル
短期間での「がん死」を予測するAIツール
卵巣がん病理画像からPARP阻害剤の治療効果を予測するAI
ドイツの研究チームは、卵巣がん患者の病理画像から、相同組換え修復欠損(HRD)の状態と、PARP阻害剤の感受性を予測するディープラーニングモデルについての研究成果を発表した。本論文はEuropean Journal of Cancerに掲載されている。
PARP阻害剤は、卵巣がん患者に用いられる化学療法の一つであり、腫瘍組織において、相同組換え修復という遺伝子修復機構に欠損が認められる場合、有効性が高いことが示されている。これまでHRD状態の評価には、次世代シーケンサーを用いた検査が必要であったが、本モデルは迅速かつ低コストな代替手段となる可能性を持つ。
研究論文によると、チームは208人の患者から得た208枚のHE染色の病理画像のデータに対して、事前学習済みの畳み込みニューラルネットワーク(CNN)を用いて特徴量を抽出し、HRD状態の分類タスクについてTransformerモデルに教師あり学習を行った。AUCは0.72という性能を示したが、外的検証ではAUCが0.57であった。一方で、生存時間解析では、同モデルを用いて定義されたHRD陽性患者群の無増悪生存期間(PFS)がHRD陰性群よりも延長していることが確認され、PARP阻害剤の感受性を予測できる可能性が示唆された。
著者らは、本研究について「同様のモデルで、外的検証において十分な精度を示したものは未だなく、今後の課題である。染色法や学習データのアノテーション方法、データサイズの工夫による精度向上を目指す」と述べている。また、PARP阻害剤の治療効果予測においては、より適切な治療選択が可能になることが期待される。
参照論文:
Predicting benefit from PARP inhibitors using deep learning on H&E-stained ovarian cancer slides
関連記事:
乳がん病理画像から「HER2発現の有無」を予測するAI
CT画像から消化管間質腫瘍の細胞増殖マーカー「Ki-67」の有無を予測
後腹膜肉腫の悪性度をCT画像から予測
レビュー論文 ― 腫瘍学におけるAI利用
ポーランドの研究チームが、腫瘍学におけるAIの果たす役割につき包括的に調査し、2024年12月30日、Applied Sciencesにレビュー論文を発表した。
腫瘍学におけるAIの最大の応用分野は診断であり(80%以上)、特に放射線学と病理学において顕著である。主に、腫瘍の遺伝子的特徴と画像の評価に焦点がおかれ、実臨床では、乳癌、肺癌、子宮頸癌、膵臓癌、大腸癌、前立腺癌において、広くAIの早期診断が活用されている。また、予後、再発、治療の有効性、有害事象などの予測や、抗がん剤、放射線療法など適切な治療方法の選択にも、AIが利益をもたらす可能性がある。さらに、新薬開発においては、腫瘍の成長速度、分子プロファイリング、薬理学的特性などのパラメーターが考慮された多様なモデルが開発されている。さらに、臨床試験におけるAIの役割は、臨床試験の設計、患者の募集や登録、患者のモニタリング、服薬の遵守などが含まれている。
筆者らは、データ収集が困難な希少がんや小児がんでのAIの活用の遅れや、病理学や放射線学における診断以外へのAIの活用の促進、AI利用における倫理的・法的側面の問題を、今後の課題として指摘している。本論文は、腫瘍学におけるAI活用や課題について包括的に知識を得られるレビュー論文となっている。全文が無料で閲覧可能であるため、興味のある読者はぜひ一度目を通すことを推奨したい。
参照論文:Artificial Intelligence in Oncology
関連論文:
胆管癌、肝細胞癌を検出・鑑別する超音波AI
頭頸部がんの治療強度を下げるためのAI利用
GoogleのAIシステム 前立腺癌細胞を70%の精度で検出
機械学習と深層学習を用いた神経膠芽腫患者の生存予測:システマティックレビュー
神経膠芽腫(GBM:Glioblastoma)の生存期間の中央値はわずか12-15か月であり、最も悪性度の高い脳腫瘍(グレード Ⅳ)とされている。2024年12月27日、BMC Cancerに「機械学習と深層学習を使用した神経膠芽腫患者の生存予測」に関するレビュー論文が掲載された。筆者らは、臨床像、分子マーカー、画像的特徴など、さまざまなデータからGBMの生存を予測するための方法について分析・要約した。
研究チームは、2015年から2024年において、「神経膠芽腫」「深層学習」「機械学習」「生存予測」のキーワードから、PubMed、Nature、ScienceDirect、Springer、Wiley、MDPI、Google Scholarのデータベースを検索し、機械学習または深層学習によるGBM患者の生存予測に関連する研究を検索し、基準を満たす107の論文についてレビューを行った。結果、GBMの生存予測に最も頻繁に用いられた機械学習方法はランダムフォレストであり、最も利用された入力データは、ラジオミクスと臨床データの組み合わせであった。また、プログラミング言語は、Pythonが最も頻繁に使用されていた。
このシステマティックレビューは、AIによるGBM生存予測により、個別化医療を実現できる可能性を示唆するものの、現時点ではこれらのシステムは臨床応用されていない。筆者らは、多施設前向き研究によるモデルの外的妥当性検証の必要性を強調している。
参照論文:
Survival prediction of glioblastoma patients using machine learning and deep learning: a systematic review
関連論文:
機械学習による脳腫瘍の悪精度判定
MRI画像から脳腫瘍の硬さを自動検出
AIによる肝細胞がんの予後予測 – システマティックレビュー
AIによる陰部皮膚疾患の診断
外陰部の皮膚疾患は、患者の羞恥心や診察への抵抗感から早期診断が遅れることが課題とされてきた。中国の研究チームは、陰部皮膚疾患(PPSD:Private Part Skin Disease)の診断補助を目的とするAIシステムを開発し、Journal of Medical Internet Researchに公表した。
既存のAI診断システムは、皮膚病変画像と疾患の組み合わせを直接学習させる方法が採用されている。一方で、今回開発されたシステムは、第1段階において、マルチタスク検出モデルにより、種類、色、形状などの皮膚病変の特徴を抽出し、これらの特徴と患者の診療録を、第2段階として皮膚科医の専門知識によって構築されたナレッジグラフへ入力することで最終的な診断を行う。本システムは、635人の患者のデータにより検証され、平均精度、再現率、F1スコアはそれぞれ 0.81、0.86、0.83 であり、既存の高度な機械学習アルゴリズムよりも優れた結果が得られた。実際の運用においては、患者本人が皮膚病変の写真を撮影、病歴を記載し、本システムにアップロードする。これらのデータは皮膚科医に送信され、最終的な診断結果と治療計画が作成される。
筆者らは、「本AI診断システムにより、患者が皮膚科医との対面診断を避けることができるため、羞恥心などによる診断の遅れを回避できる可能性があり、かつ、PPSD診断の精度向上にも役立つ」と指摘している。
参照論文:
Artificial Intelligence-Aided Diagnosis System for the Detection and Classification of Private-Part Skin Diseases: Decision Analytical...
心エコー・電子カルテ情報から心室中隔欠損の自然閉鎖を予測
心室中隔欠損(VSD)は、先天性心疾患の中で最も発生頻度が高い疾患であり、自然閉鎖が起こるか否かが治療方針に影響を与える。中国の上海交通大学の研究チームはこのほど、自然言語処理(NLP)技術と機械学習を組み合わせ、高い精度で自然閉鎖の有無を予測するモデルを発表した。
The Lancet Digital Healthに発表された同研究では、29,142人の患児の心エコーレポート・電子カルテを元に、NLP技術で自由記述形式から構造化データに変換し、LASSO法で特徴量の選択を行った。併存疾患(ASD, PFO)の有無や欠損の形態など11個の特徴量を用い、Random Survival Forest(RSF)モデルで1歳/3歳/5歳時点での自然閉鎖の有無を予測させた結果、いずれもAUCが0.95を超える高い予測精度を示した。また重要な特徴量として、欠損の形態(大きさ、位置、シャントサイズ)や初診時の患児の年齢が挙げられ、各患者のリスクを計算することで、自然閉鎖の確率が高い群と低い群に効果的に分類することが可能であった。
研究チームのメンバーは「早期に高い精度で予測を行うことで、治療介入の遅れを防ぐことが出来る。また、本研究はNLP技術と機械学習モデルの組み合わせを、先天性心疾患に適用した先駆的な取り組みであり、他分野にも応用可能だ」と述べている。今後は、複数の医療期間での検証や、介入時期の難しい他疾患への研究の展開が期待される。また、NLP技術で非構造化データから情報を抽出する手法の確立によって、利用可能なデータの幅が広がることが望まれる。
参照論文:
Leveraging artificial intelligence for predicting spontaneous closure of perimembranous ventricular septal defect in children: a multicentre, retrospective study...
救急外来の虫垂炎を早期に特定するAI
急性腹症は、救急外来(Emergency Department: ED)受診の全体の5〜10%を占め、中でも急性虫垂炎は頻繁に遭遇する疾患の一つである。Alvaradoスコアをはじめとする、虫垂炎診断予測スコアが開発されているが、虫垂炎とその他の急性腹症との鑑別は依然として臨床的に重要な課題である。オランダの研究チームが、2024年12月23日、World Journal of Emergency Surgeryに、EDにおける急性腹症症例から虫垂炎を早期特定するための機械学習(ML)モデルに関する研究結果を公表した。
同研究では、EDを受診した350例の急性腹症症例から、病歴、バイタルサイン、身体所見、臨床検査結果のデータが抽出され、虫垂炎の早期診断を目的に2種類のMLモデルが構築された。1つは、病歴、バイタルサイン、身体所見を使用したモデル(HIVE)であり、もう1つは、これらに加え検査結果(血液・画像検査)を含めたモデル(HIVE-LAB)である。研究チームは、これら2つのMLモデルを、AUROCを最適化するよう訓練し、その結果をAlvaradoスコアと比較した。結果、虫垂炎とその他の急性腹症の鑑別において、HIVEは0.919、HIVE-LABは0.923のAUROCを達成し、両者に統計学的有意差は認めなかった。AlvaradoスコアのAUROCは、MLモデルと比較し有意に低かった(0.824)。
研究チームは、「HIVEモデルを導入することで、ED受診から早い段階で、臨床検査に依存することなく、虫垂炎の可能性の高い患者を特定できる」とコメントしている。また、プライマリーケア医のEDへの紹介精度を高められる可能性も指摘している。今後、臨床検査に頼らないHIVEモデルを、様々な集団や臨床現場において検証することで、本モデルがより一般化されることが期待される。
参照論文:
Machine-learning based prediction of appendicitis for patients presenting with acute abdominal pain at the emergency department
関連記事:
高齢者のER受診と入院を79%減少させるAIツール
救急部での臨床判断を支える「新しい機械学習トリアージツール」
...
非小細胞肺癌に対する免疫療法の治療効果を予測するAI研究 – ハーバード大学
進行性/転移性非小細胞肺癌(NSCLC)に対する免疫チェックポイント阻害剤(ICI)単剤治療の効果予測因子として、PD-L1の発現が臨床的に最も使用されているが、予測精度は限定的である。Harvard Medical Schoolの研究チームは、NSCLC患者のHE染色された病理標本から、ICIの有効性を予測するDeep Learning Model(Deep-IO)を開発した。
JAMA Oncologyに掲載された同研究では、ICI単剤療法を受けたNSCLC患者958人から得られた295,581枚のHE染色された病理画像を解析対象とし、ICIの有効性を予測した。検証の結果、Deep-IOによるICIの有効性の識別性能としてのAUCで、内部コホートで0.75、検証コホートで0.66であった。調整されたDeep-IOによるAUCは、内部コホートでは、その他の予測因子(遺伝子変異量、PD-L1、腫瘍浸潤リンパ球)より高く、検証コホートでは腫瘍浸潤リンパ球よりも優れており、かつ、PD-L1と同等であった。
著者らは「病理標本を用いたDeep Learning Modelにより、NSCLCに対してICI治療が有効である可能性の高い患者を効率的に同定できる可能性がある」と考察している。一方で、0.8以上の理想的なAUCには届かなかったため、さらなる改良による精度向上が期待される。
参照論文:
Deep Learning Model for Predicting Immunotherapy Response in Advanced Non−Small Cell Lung Cancer
関連記事:
がん免疫療法の治療反応を予測する「説明可能なAI」
進行性メラノーマに対する免疫療法での治療反応を予測するAI研究
肺がん免疫療法への治療反応性を予測するAIモデル