2025 | 医療とAIのニュース・最新記事 - The Medical AI Times

医療とAIのニュース 2025

NICUにおける滞在期間と予後予測に関するAI：システマティックレビュー

Kazuyo NAGASHIMA - 2025年10月16日

毎年約1,500万人の早産児が生まれ、そのうち約100万人が死亡していると推定されており、新生児集中治療室（NICU）でのケアは非常に重要である。研究者らは、NICUの現場で使用され得るAIの研究の全体像を分析し、システマティックレビューを実施した。 Journal of Medical Internet Researchに掲載された論文によると、研究チームは6つのデータベースを用いて、2017年から2023年の間に発表されたNICU患者が対象となるAIの論文を検索した。その結果、24件の研究がレビュー対象となっている。このうち、NICU滞在中の死亡率に関する研究は4件、NICUの滞在期間予測に関する論文は2件特定された。本レビューが整理したAIの介入機会は4つで、①医療画像の進歩（例：未熟児網膜症における重症度評価や予後予測、脳拡散MRIを用いた運動予後の予測）、②データ駆動インサイトと予測モデル（滞在期間・重症度・死亡リスクなどの予測によるケア計画支援）、③疾患理解の深掘りとリスク層別化、④個別化された新生児ケアと介入、が挙げられた。一方で課題として、データの質と量（単施設・小規模・欠損、ノイズ）、臨床的解釈性と使い勝手（説明可能性や現場ワークフロー適合）、モデルの一般化と外部検証の不足（装置・施設・集団差による性能低下）、倫理・規制面（プライバシー、バイアス、責任の所在）などが指摘されている。今回のシステマティックレビューにより、NICU分野におけるAIの応用が有望であることが示された。研究者らは「AIの活用により、診断精度の向上、早期治療の開始、臨床意思決定の改善、病態理解などが期待される一方で、克服すべき課題も多く存在する」と述べている。参照論文： Opportunities and Challenges of Using Artificial Intelligence in Predicting Clinical Outcomes and Length of Stay in Neonatal Intensive Care Units:...

眼疾患画像診断におけるAI臨床応用のギャップ

本吉絢 - 2025年10月14日

光干渉断層撮影（OCT）は、眼の微細構造を可視化し、失明につながりうる眼疾患の診断に不可欠な検査機器である。近年、OCTベースの眼疾患診断におけるディープラーニング（DL）の応用は一定の研究成果をあげているが、臨床応用まで十分に至っていない。研究チームは、臨床と研究の間に存在するギャップを明らかにし、臨床導入のための解決策を提案することを目的としてレビューを実施した。本論文では、OCTを用いたDL応用の中でも特に重要なタスクである疾患分類と画像セグメンテーションに焦点を当てている。疾患分類は眼科疾患の早期発見に直結し、画像セグメンテーションは病変領域の定量評価に不可欠である。加齢黄斑変性や糖尿病黄斑浮腫といった疾患は複数のデータセットが存在する一方で角膜炎や中心性漿液性脈絡網膜症などの疾患は比較的データセットが少ないという眼疾患の偏りを指摘した。また、約3割のデータセットは非公開データセットであり共同研究の障壁となっていることを指摘している。さらに、異なるOCT機器間での汎用困難性（DICE係数で最大15%低下）、OCTデータ量の不足、ラベル付け作業の負担、モデルのブラックボックス性といった課題についても議論している。本レビューでは、DLによるOCT解析が精度と効率の面で大きな進歩をもたらしたと評価する一方、臨床応用には依然として課題が残ると指摘する。特に、データセットの多様性の確保、モデルの解釈可能性向上、計算効率改善が今後克服すべき重要な障壁であると述べた。将来展望としては、異なるOCT機器間での汎用性、自己教師あり学習などを用いたデータ駆動型モデルの強化、OCTと他モダリティを組み合わせたマルチモーダル解析、軽量かつ高性能なモデル開発と、多施設共同での検証体制の整備などが、AIをOCT診断支援として定着させる鍵になるとしている。参照論文： A comprehensive review of deep learning in OCT image segmentation and classification 関連記事：糖尿病に伴う全身性血管障害を網膜画像から予測するAI：システマティックレビュー Eye in the Sky: Defender – ビデオゲームで網膜OCT画像をデータ処理緑内障の進行予測を行うAI

AIを用いた二重読影が、乳がん検診の精度を向上させる―Lancet誌―

R.A. - 2025年10月10日

一般集団を対象としたマンモグラフィ検診は、乳がんによる死亡率を減少させる効果が認められている一方で、マンモグラフィ感度の限界、放射線科医の習熟度などの課題が存在する。この課題に対し、オランダの研究チームが、検診の精度向上に寄与する高性能なAIの研究成果を発表した。同研究はThe Lancet Digital Healthに掲載されている。本研究では、20万件の正常データと1万件の乳がんデータを用いて、画像分析アルゴリズムと畳み込みニューラルネットワークから成る「Transpara」システムの学習を行った。本システムは、入力画像に対して、病変部の検出と病変疑いスコア（1-100）、悪性度スコア（1-10）を出力するものである。タスクとして、42,236件の2Dマンモグラム及び4年フォローアップのアウトカムデータ（検診で発見されたがん、検診から22ヶ月以内に発見されたがん：中間期がん、検診から22ヶ月後に発見されたがん：将来診断がん）を用い、ヒトによる読影と同システムを用いたAI読影を、様々なパターンで組み合わせた際の精度比較を行った。その結果、ヒト読影＋AI読影では、ヒトによる二重読影と比較して、8.4％の感度上昇が見られた。特に、AI読影は人の二重読影が見逃した中間期・将来診断がんの多くを拾い上げた。これらのがんは最終的に浸潤性・腫瘍径が大きい傾向にあり、臨床的意義が高い可能性がある。この効果は、乳房密度に依存しないことが示されている。研究チームは「ヒト読影にAI読影を組み合わせることで、精度向上を図ることが可能となった。だが、同時に特異度がやや下がるという難点があり、スクリーニング検査における再検査率を上昇させることは実運用上の課題になりうる。閾値を適切に設定することで、実臨床への運用に活かしたい」と述べている。参照論文：AI as an independent second reader in detection of clinically relevant breast cancers within a population-based screening programme in the Netherlands:...

甲状腺結節の超音波ベースのAI診断モデル：システマティックレビュー

Kazuyo NAGASHIMA - 2025年10月9日

甲状腺結節の超音波検査による診断は、超音波検査技師や放射線科医の技量や主観に左右されることがあるが、AIは誤診や過剰な細針吸引生検を防ぎ、診断から治療開始までの時間を短縮する可能性がある。中国の研究チームは、甲状腺結節の超音波ベースAI診断モデルを体系的に評価することを目的としてシステマティックレビューを実施した。 2025年9月3日にFrontiersに発表された論文によると、研究チームはPubMed、Web of Science、Cochrane Libraryを用いて、甲状腺結節の超音波検査診断におけるAIの応用に関する文献検索を行った。その結果、134,028名の患者、158,161個の甲状腺結節、529,479枚の超音波画像を含む28件の研究が評価対象となった。AIモデルについては、畳み込みニューラルネットワークが17件、人工ニューラルネットワークが2件、ランダムフォレストが3件、混合モデルが6件含まれていた。AI支援診断は、感度0.89、特異度0.84、陽性尤度比5.60、陰性尤度比0.13、診断的オッズ比43.94、AUC0.93と高い診断性能を示した。なかでも、DenseNetに基づくアンサンブルモデルであるEDLC-TN（Ensemble Deep Learning Classification Model for Thyroid Nodules）は、正解率98.51%と他のモデルを大きく上回るパフォーマンスを達成した。本レビューにより、AI支援による超音波検査を用いた甲状腺結節の診断は、臨床現場での応用可能性が高いことが示された。特に、農村部やプライマリーケアなどリソースが限られた環境における甲状腺がんの早期発見が期待される。研究者らは、「超音波検査におけるリアルタイムのデータ処理は、静的画像の約100倍のデータ量を必要とするため、将来的には3D CNNとTransformerを組み合わせた新たなニューラルネットワークアーキテクチャの開発が求められる」と述べている。参照論文： Diagnostic performance of ultrasound characteristics-based artificial intelligence models for thyroid nodules: a systematic...

AI導入がもたらす内視鏡医スキル低下の可能性

本吉絢 - 2025年10月8日

大腸内視鏡検査におけるAIを使用したポリープ検出は、ポリープ検出率を向上させることが知られているが、AIの継続使用により「内視鏡医自身のポリープを検出するスキル」が低下する可能性がある。ポーランドの複数の内視鏡センターで行われた観察研究が、そのリスクを示し、Lancet誌に報告された。ポーランドの研究チームは、ポリープ検出AIツールを導入したポーランドの4つの内視鏡センターで、AI導入前後での、AI非使用下の大腸内視鏡検査における内視鏡医のポリープ検出率の変化を調査した。その結果、内視鏡医のポリープ検出率は、AI導入前は28.4%から、AI導入後22.4%へと有意に低下し、絶対差は-6.0%であった（p=0.0089）。研究者らは、これは特定のAI機器に限った現象ではなく、人間がAIに過度に依存する傾向を反映している可能性が高いと指摘。今後はAIが医師の診断スキルにどのような影響を及ぼすか、そのメカニズムを明らかにする研究が必要だと述べている。参照論文： Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study 関連記事：上部内視鏡検査においてBorrmann4型胃がんの検出を行うAI デンマークが「AI支援大腸内視鏡検査を推奨しない」理由カプセル内視鏡検査のディープラーニング解析

パーキンソン病を予測する「説明可能なAI」

Kazuyo NAGASHIMA - 2025年10月2日

パーキンソン病（PD）の診断は、臨床症状、既往歴、神経学的評価に基づいて行われるが、これらの方法は主観的であり、専門家の判断に依存しているため、診断のばらつきや誤診のリスクが存在する。PDの予測に関する機械学習研究の多くは、音声や歩行パターンなど単一のモダリティに依存している。そこで研究チームは、マルチモーダルなデータセットを用いてPD予測を目的とした機械学習モデルを開発した。 9月5日付で、Current Research in Translational Medicineに発表された論文によると、5つの機械学習モデル（サポートベクターマシン、k近傍法、ロジスティック回帰、ランダムフォレスト、XGBoost）が、Kaggleから得られた多様なデータセット（n=2105）を用いてトレーニングされた。その結果、ランダムフォレストと変数減少法を組み合わせることで、優れたパフォーマンスを達成した（正解率：93%、適合率：93%、再現率：93%、F1スコア：93%、AUC：0.97）。SHAP分析では、UPDRSスコア（パーキンソン病の評価ツール）や機能評価スコアが、LIME分析（Local Interpretable Model-agnostic Explanations）では、運動症状（振戦、固縮、寡動など）や認知機能障害が重要な特徴量として特定された。上記実験結果は、本モデルが早期パーキンソン病（PD）特定のためのスクリーニングツールとして有用であり、重篤な症状が現れる前にリスク患者を特定できる可能性を示している。研究チームは、「PDの予測精度を向上させるためには、遺伝子バイオマーカーやMRI、DaTscanなどの画像検査データをデータセットに含めるとともに、外部検証を実施して一般化可能性を担保する必要がある」と述べている。参照論文： Explainable AI for Parkinson’s disease prediction: A machine learning approach with interpretable models 関連記事：ウェブカメラとAIによる「パーキンソン病の家庭評価」 AIとメタボロミクスによるパーキンソン病の発症予測音声と表情からパーキンソン病を早期発見

病変セグメンテーションのための大規模皮膚病理データセット

Kazuyo NAGASHIMA - 2025年10月1日

皮膚がんの発生は、高齢化と日光曝露の増加により、世界的に増加傾向にある。診断には病理学的評価が重要であるが、病理医の負担増加による診断エラーを防ぐためにAIの活用が期待されている。韓国の研究チームは、大規模な皮膚病理データセットを構築し、AIモデルをトレーニングしてその精度を評価した。研究成果は9月8日付でJournal of Korean Medical Scienceに公表された。データセットは、韓国内の4つの施設から収集された34,376件の病理デジタル画像をもとに構築された。研究チームは、ImageNetで事前学習されたResNet50を用い、全スライド画像から抽出したパッチ（切り出し画像）を使ってトレーニングを行った。パフォーマンスはダイス係数で評価され、表皮嚢胞が最高値の90.1％を記録し、ボーエン病および扁平上皮癌が最も低い82％であった。これは、臨床的にボーエン病と高分化扁平上皮癌の鑑別が時に困難であることと一致している。その他、脂漏性角化症は89.9％、基底細胞癌は88.9％、色素細胞母斑は84.3％、悪性黒色腫は87.4％と、いずれも高いダイス係数を示した。今回の研究では、多施設から収集された皮膚病理の大規模データセットが深層学習のトレーニングにおいて優れた資源となり、モデルの性能向上に寄与する可能性が示された。研究者らは「本研究はアジア人のみを対象としており、人種の多様性に欠けているため、将来的にはThe Cancer Genome Atlasなどの公開されている外部データを用いてさらなる検証が必要である」と述べている。参照論文： Large-Scale Dermatopathology Dataset for Lesion Segmentation: Model Development and Analysis 関連記事：皮膚科医全員の診断精度を上回る「メラノーマ識別AI」 AIを用いた皮膚がんの再発予測病理診断の未来へ – 米Prosciaの取り組み

説明可能AIが腰痛管理の複合的要因を明らかにする

本吉絢 - 2025年9月29日

腰痛の疼痛管理は、多様な要因に配慮した個別の対応が不可欠であるが、従来のアプローチでは単一の原因のみしか解明できず、複合的な要因を持つ患者への対処が困難である。米カルフォルニア大学サンフランシスコ校の研究チームは、非特異的慢性腰痛（ns-cLBP）の薬物処方における複雑に絡み合う生物学的要因と心理社会的要因の影響を、電子カルテ（EMR）データと説明可能AIを用いて明らかにし、Nature誌Scientific Reportsで報告した。研究対象は、2012年から2024年までに腰椎MRIを受けた4,077人のns-cLBP患者で、無処方の患者（52％）、NSAIDsを処方された患者（37％）、オピオイドを処方された患者（11％）が調査された。研究では、臨床記録（年齢、診断名、社会的背景）、心理・社会的要因、MRIによる診断レポートなどを統合し、EMRデータを大規模言語モデル（LLM）プロンプト等で取り出して特徴量化し、これを基に、ツリー型分類AIアルゴリズムで処方薬を予測し、説明可能AIであるSHAPによる特徴量の重要度分析を行った。その結果、画像診断よりも患者報告や診断記録が処方判断に寄与することが示された。また、生物学的要因として、最初のMRIを受けた年、脊柱管狭窄症、変形性関節症等の疾患は薬剤処方の可能性を高めた。さらに、心理社会的要因として不安症またはうつ病患者、女性患者、パートナーを持つ患者には薬剤処方との関連がある傾向が見られた。研究チームは「慢性疼痛管理の際の複雑な病態における意思決定を解釈可能にすることで、個別化医療や公正な薬物処方に向けたアプローチを推進できる」とコメントしている。今後の研究では、より詳細な処方内容や疼痛スコアなどの患者のアウトカムを含むことで、処方の適切性を評価するとのことだ。参照論文： Explainable AI reveals tissue pathology and psychosocial drivers of opioid prescription for non-specific chronic low back pain 関連記事：腰痛治療を標準化するモーションセンシング技術口腔がん・中咽頭がんの放射線治療中における急性疼痛とオピオイド投与量を予測する機械学習モデル婦人科手術後のオピオイド使用を予測するAIモデル

創薬におけるAIの応用：システマティックレビュー

Kazuyo NAGASHIMA - 2025年9月25日

創薬には膨大な時間と労力、多額の費用がかかるため、AIの応用が期待される分野である。さらに、創薬に関する基礎研究から臨床応用への橋渡しにおいても、AIが果たす役割がある可能性がある。研究チームは、創薬におけるAI応用の現状を整理することを目的としてシステマティックレビューを実施した。 8月29日にDrug Design, Development and Therapyに発表された論文によると、研究チームはPubMedなどのデータベースを用いて、「AI」「新薬発見」「機械学習」「トランスレーショナルメディシン」「臨床試験」などのキーワードで、2014年から2024年の間に公表された創薬に関する論文を検索した。新薬の発見におけるAIの応用例としては、分子モデリングや医薬品設計、バーチャルスクリーニングが挙げられ、開発段階ではドラッグリポジショニング、前臨床試験、臨床試験においてAIが活用されていた。基礎研究から臨床応用にかけては、患者のゲノム配列から最適ながん治療を特定するなど、オーダーメイド医療にAIが役立てられていた。具体的には、AlphaFold社によるタンパク質立体構造の予測、BenevolentAI社による既存薬のCOVID-19 へのリポジショニング、Insilico Medicine社による特発性肺線維症の候補薬の設計、Atomwise社によるエボラの候補薬を1日未満で抽出した例などが挙げられた。今回のレビューにより、AIが新薬の発見・開発において、コスト削減や時間短縮、さらには薬剤の有効性や毒性の予測に役立つことが示された。一方で、データの品質管理、モデルの解釈可能性、倫理やプライバシー保護に関する規制など、考慮すべき課題も存在する。研究者らは「創薬におけるAIの恩恵を患者に届けるためには、研究者と実務家が協力し続けることが不可欠である」と述べている。参照論文： Transformative Role of Artificial Intelligence in Drug Discovery and Translational Medicine: Innovations, Challenges, and Future Prospects 関連記事：機械学習により創薬スクリーニングを10倍高速化 AI創薬の支援プラットフォーム AIによる創薬 – 知的財産権は誰のものに？

DeepSeek-R1が眼科診断でOpenAI o1を上回る

Daiju Ueda - 2025年9月22日

モントリオール大学らの研究グループが、オープンウェイトの大規模言語モデル「DeepSeek-R1」と、OpenAIの「o1」モデルを眼科診断において比較した結果をJAMA Ophthalmologyに発表した。JAMA Ophthalmologyの臨床症例422例を用いた横断的評価において、DeepSeek-R1がo1を診断精度と次の治療ステップの精度の両面で上回り、さらに運用コストも大幅に削減できることが明らかになった。研究では、網膜・硝子体、神経眼科、ぶどう膜炎、小児眼科など10の眼科専門分野から収集された422症例を対象とした。各症例には診断を問う自由記述問題と、次の治療ステップを選択する多肢選択問題が含まれていた。Plan-and-Solve Plus（PS+）プロンプト手法を用いて両モデルを評価した結果、診断精度はDeepSeek-R1が70.4%（297/422例）、OpenAI o1が63.0%（266/422例）となり、7.3ポイントの差が認められた（95%信頼区間：1.0%-13.7%、p=0.02）。次の治療ステップ決定においても、DeepSeek-R1が82.7%（349/422例）、OpenAI o1が75.8%（320/422例）の精度を示し、6.9ポイントの有意差が確認された（95%信頼区間：1.4%-12.3%、p=0.01）。専門分野別では、眼形成外科において最も顕著な差が見られ、次の治療ステップ決定でDeepSeek-R1が96.8%、OpenAI o1が77.4%の精度を記録した。コスト分析では、DeepSeek-R1のAPI使用時の費用はOpenAI o1の6.6%に相当し、オフピーク時の割引適用により1.5%まで削減可能であることが示された。両モデル間の一致度は中程度（κ=0.422）であった。研究者らは、DeepSeek-R1の強化学習による推論能力の向上と、思考の連鎖（Chain-of-Thought）の明確化が診断精度向上に寄与したと分析している。ただし、大規模言語モデルを臨床診断に直接利用することについては、十分な検証と安全性の確保が必要であり、医師の判断を代替するものではないとも述べている。今後は画像解析能力の向上と、眼科専門知識に特化したモデルの開発が期待される。参照論文：DeepSeek-R1 vs OpenAI o1 for Ophthalmic Diagnoses and Management Plans 関連記事：1. Googleの医療AI「AMIE」が優れた鑑別診断をアシスト2. 医療LLMの診断精度は「人間との対話」を介して大きく低下する3. 生成AIと医師の診断精度を比較：システマティックレビュー&メタアナリシス

胎児死亡リスクを予測する機械学習モデル：ブラジルからの報告

Kazuyo NAGASHIMA - 2025年9月19日

UNICEF（国連児童基金）によると、毎年妊娠28週以降の胎児約190万人が死亡している。胎児および乳児の高い死亡率は、ブラジルにおいても大きな社会的課題であり、その背景には多様な要因が存在している。ブラジルの研究チームは、社会人口統計学的属性と母体の健康状態をもとに、妊娠中の胎児死亡を予測する機械学習モデルを構築し、その成果をBMC Pregnancy and Childbirthに公表した。 9月1日に発表された論文によると、ブラジルのペルナンブコ州が運営する、231,505名のデータと71の属性を含むデータセットを用いて、決定木、ランダムフォレスト、Adaptive Boosting、XGBoostの4種類の機械学習モデルが訓練された。その結果、XGBoostモデルは感度を除くすべての指標で優れたパフォーマンスを示した（感度：33.21％、特異度：81.06％、正答率：79.37％、F1スコア：49.27％）。胎児死亡予測において重要な属性として、初回の出生前ケア訪問の時期、母親の年齢、学歴、妊娠間隔が特定された。本AIモデルは、社会人口統計学的データ、臨床データ、家族歴などを分析することで、死産リスクを特定し、早期介入を可能にする可能性がある。研究者らは「今回のモデルは胎児死亡の予測に優れた性能を示したものの、感度が低いため、死産リスクの症例を十分に捉えられていない可能性がある。今後はハイブリッド機械学習モデルの開発を進め、ブラジルの公衆衛生対策に活用できるよう目指す」と述べている。参照論文： Machine learning for preventing stillbirths: is it possible to transform data into life-saving insights? 関連記事： AIによるモニタリングで妊婦と胎児の死亡率低下を実現分娩中にリアルタイムでリスク予測「貧困地域で正確な妊娠週数」を算出するAI超音波システム

MRI前立腺分割・がん検出の連合学習最適化シミュレーション研究

Daiju Ueda - 2025年9月18日

ノルウェー科学技術大学の研究チームがRadiology: Artificial Intelligenceで発表した研究により、連合学習（FL）フレームワークがMRI前立腺分割および有意な前立腺がん検出の性能を大幅に向上させることが明らかになった。連合学習（FL）とは、患者データを各施設に留めたままローカルで学習し、更新したモデルパラメータだけを統合する分散学習手法である。この研究では、4つの施設からの1,294例の前立腺分割データと3つの施設からの1,440例のがん検出データを使用し、FlowerフレームワークによるnnU-Netベースアーキテクチャを訓練した。研究結果は、FLにより両タスクで著しい性能改善を示した。前立腺分割では、1エポック300ラウンドのFedMedian集約により、Diceスコアが各施設のローカル学習の平均性能0.73±0.06から0.88±0.03へ向上した（p≤0.01）。がん検出では、5エポック200ラウンドのFedAdagrad集約により、PI-CAIスコアが0.63±0.07から0.74±0.06へ改善した（p≤0.01）。興味深いことに、最適化されたFLモデルは集中学習ベースラインと同等の性能を達成し、前立腺分割では有意差を示さなかった（Diceスコア0.87±0.03対0.88±0.03、p>0.05）。一方、がん検出では最適化により独立テストセットでベースラインFLモデルより有意に向上した（PI-CAIスコア0.72±0.06から0.74±0.06、p≤0.01）。研究者らは、各機関が協力することにより前立腺分割およびがん検出モデルの性能を改善できると述べている。この手法により、プライバシーを保護しながらより汎化性の高いモデル開発が可能となり、実際の臨床環境での連合学習実装への道筋を示すものである。参照論文：Optimizing Federated Learning Configurations for MRI Prostate Segmentation and Cancer Detection: A Simulation Study 関連記事：1. 進行性前立腺がんの予後予測AIモデル：大規模無作為化第三相試験データを用いた外部検証2. 前立腺がんのMRI画像診断の精度：AI支援あり vs AI支援なし3. AIが「MRIにおける前立腺がん検出」を支援

機械学習でダウン症のアルツハイマー進行段階を解明

Daiju Ueda - 2025年9月17日

英国の研究チームがダウン症患者57名を対象とした研究で、血液バイオマーカーと認知機能検査を組み合わせて機械学習によりアルツハイマー病（AD）の進行段階を予測する手法を開発したことがAlzheimer's & Dementiaに発表された。ダウン症患者は21番染色体の3倍体によりアルツハイマー病リスクが極めて高く、一般集団より約25年早い40歳頃から病理変化が現れることが知られている。研究では20～35歳の若年群29名と36～59歳の高年群28名に分け、血漿中のアミロイドβ42/40比、リン酸化タウ181・231、ニューロフィラメント軽鎖（NfL）、グリア線維性酸性タンパク質（GFAP）の5種のバイオマーカーと4つの認知機能テストの結果をイベントベースモデルで解析した。その結果、最初にアミロイドβ42/40比の低下とNfLの上昇が起こり、続いて記憶機能の低下が生じることが判明した。その後リン酸化タウの増加と実行機能の低下、最終的に視覚運動機能の低下とGFAPの上昇という段階的進行パターンが明らかになった。主成分分析と一般化加法モデルにより、39～52歳の年齢範囲でバイオマーカー変化が最も顕著であることも示された。このタイミングは平均診断年齢53.8歳の約15年前に相当し、統計的に有意な変化を示した(P<0.001)。研究者らは「ダウン症におけるAD進行パターンが家族性・孤発性ADと類似していることが確認され、血漿バイオマーカーの組み合わせが前臨床段階の診断や治療介入のタイミング決定に有用である」とコメントしている。この成果により、より効果的な早期診断システムの構築と、治療効果を評価する臨床試験の設計改善が期待される。参照論文：Staging of Alzheimer's disease progression in Down syndrome using mixed clinical and plasma biomarker measures with machine learning 関連記事：1. 電子カルテから発症5年前にアルツハイマー病を予測2. 発話からアルツハイマー病の初期症状を捉えるAI3. 脳免疫細胞が初期アルツハイマーと戦う可能性

乳がんMRI検査でAI異常検出モデルが高精度を実現

Daiju Ueda - 2025年9月16日

米ワシントン大学医学部などの研究チームが、乳房MRI検査におけるがん検出のための説明可能なAI異常検出モデルを開発し、従来の二値分類モデルを上回る性能を示したことをRadiologyに発表した。このモデルは、がん有病率の高い集団と低い集団の両方で優れた検出能力を発揮し、腫瘍の位置を正確に特定できる説明性も備えている。研究では9,738件の乳房MRI検査データを用いて完全畳み込みデータ記述（FCDD）異常検出モデルを開発した。このモデルは正常な乳房組織の特徴を学習し、異常な領域を特定する仕組みである。がん有病率20.0%のデータセットでは、FCDDモデルの受信者動作特性曲線下面積（AUC）は0.84±0.01で、従来の二値交差エントロピー（BCE）モデルの0.81±0.01を有意に上回った（p<0.001）。より現実的ながん有病率1.85%の不均衡データセットでも、FCDDは0.72±0.03のAUCを達成し、BCEの0.69±0.03を上回った。97%の感度を固定した場合、FCDDの特異度は13%でBCEの9%より高く、偽陽性を平均25%削減した。説明性の評価では、FCDDが生成したヒートマップと放射線科医の注釈との空間的一致度（画素レベルAUC）は0.92±0.10で、BCEの0.81±0.13を大幅に上回った（p<0.001）。外部の多施設データセットでも同様の優れた性能が確認された。研究チームは「このモデルは乳房MRIスクリーニングにおいて放射線科医の作業負荷を軽減し、読影効率を向上させる可能性がある」とコメントしている。異常ヒートマップにより関心領域を迅速に特定でき、正常スキャンのトリアージにも活用できると期待される。今後はより大規模な病変注釈データセットでの評価や前向き研究による臨床統合の検証が必要とされる。参照論文：Cancer Detection in Breast MRI Screening via Explainable AI Anomaly Detection 関連記事：1. 乳がん超音波検査でAIの可能性を示す新研究2. 乳がん病理画像から「HER2発現の有無」を予測するAI3. 5年以内の乳がん発生リスクを予想するAI – ワシントン大学

GPT-4oが小児患者向け指示書の英語・スペイン語翻訳で高品質を実現

Daiju Ueda - 2025年9月12日

JAMA Pediatricsに掲載された研究で、OpenAI社の大規模言語モデル「GPT-4o」が小児科患者向け指導書の英語・スペイン語翻訳において、専門翻訳者と同等の品質を達成することが示された。ボストン小児病院の研究チームが実際の診療で使用された患者指導書20件を対象に、多次元品質評価（MQM）フレームワークを用いて厳密に評価した結果である。研究では約300語の小児科患者指導書を、GPT-4oと専門翻訳者がそれぞれスペイン語に翻訳し、3名の独立した専門医療翻訳者が評価した。MQMスコア（0-100点）では、GPT-4o翻訳が平均98.3点（標準偏差2.3）、専門翻訳者による翻訳が平均96.7点（標準偏差3.3）となり、統計的に有意な差は認められなかった（平均差1.6点、90%信頼区間0.7-2.5）。エラー分析では、専門翻訳者による翻訳の方が誤訳エラーが有意に多く（平均4.13件対1.77件、p=0.002）、評価者の52%がGPT-4o翻訳を好むと回答した。研究チームは医療現場に特化したプロンプトを設計し、医療情報交換（HIE）適合版GPTを使用して実際の患者データで検証を行った点が特徴的である。研究者らは、AI翻訳には依然として人間による監督が不可欠としつつも、スペイン語のような豊富な訓練データを持つ言語では、GPT-4oが翻訳業務の負荷軽減に貢献し、使用頻度の低い言語への人的資源配分を可能にすると指摘している。今後は他言語での評価や患者・介護者を含む評価プロセスの検討が必要とされる。参照論文：Evaluating a Large Language Model in Translating Patient Instructions to Spanish Using a Standardized Framework 関連記事：1. 大規模言語モデルによるトリアージプロセスの支援2. 医療LLMの診断精度は「人間との対話」を介して大きく低下する3. 生成AIと医師の診断精度を比較：システマティックレビュー&メタアナリシス

アルツハイマー病AIモデルの誤分類分析

Daiju Ueda - 2025年9月10日

脳構造MRIを用いたアルツハイマー病（AD）の人工知能診断システムにおける分類精度と限界を分析した研究がRadiology: Artificial Intelligenceに発表された。研究チームは3,258例のMRI画像を5つの多施設データセットから収集し、3D Nested Hierarchical Transformer（3DNesT）モデルを含む複数のコンピュータ支援診断（CAD）システムの性能を評価した。 3DNesTモデルは10分割交差検証で90.1±2.3%の精度を達成し、3つの外部データセットでそれぞれ82.2%、90.1%、91.6%の精度を示した。しかし重要な発見として、偽陰性（FN）群223例のうち97.3%が少なくとも1つの他のCADモデルでも誤分類され、86.1%が半数以上のモデルで、46.2%が全てのモデルで誤分類された。FN群は真陽性（TP）群と比較してMMSEスコアが有意に高く（FN：21.4±4.4、TP：19.7±5.7、P<0.001）、脳萎縮が最小限で認知機能がより保たれていた。興味深いことに、アミロイドβ（FN：705.9±353.9、TP：665.7±305.8）やタウ（FN：352.4±166.8、TP：371.0±141.8）の負荷レベルには群間差がなかった。モデル解析により、TP群では典型的なADパターンである広範囲の脳萎縮が観察されたのに対し、FN群では萎縮が最小限であることが確認された。研究者らは、FN群が非定型的な構造MRIパターンと臨床特徴を示すことで、構造MRIのみに基づくCADモデルの診断性能を根本的に制限していると結論づけた。この知見は構造MRIによるAD診断の限界を明らかにし、将来的にはマルチモーダルデータの統合と縦断的研究による診断精度向上の必要性を示唆している。参照論文：Structural MRI-based Computer-aided Diagnosis Models for Alzheimer Disease: Insights into Misclassifications and Diagnostic Limitations 関連記事：1. 電子カルテから発症5年前にアルツハイマー病を予測2. 発話からアルツハイマー病の初期症状を捉えるAI3. 脳免疫細胞が初期アルツハイマーと戦う可能性

HE染色から大腸がんにおける複数の遺伝子変異を予測する：多施設コホート研究

Kazuyo NAGASHIMA - 2025年9月9日

大腸がんの診断、治療、予後予測において、分子学的評価は極めて重要である。これまでの研究では、ヘマトキシリン・エオジン（HE）染色からKRAS変異など特定の遺伝子マーカーの変化を予測するモデルが存在したが、それぞれのモデルを個別にトレーニングする必要があり、多大な労力を要していた。今回、The Lancet Digital Healthにおいて、トランスフォーマーを用いて大腸がん病変のHE染色標本から複数の遺伝子変異を同時に予測するマルチターゲットモデルが発表された。研究チームは、7つのコホートから得られた大腸がん患者1,912名のHE染色全スライドをデジタル化し、多数のバイオマーカー（マイクロサテライト不安定性（MSI）、ハイパーミュテーション、BRAF、KRAS、RNF43、BMPR2、ZNRF3、TP53、APCなど）を検出するトランスフォーマーモデルを訓練した。その結果、このマルチターゲットモデルは、HE染色組織標本から複数のバイオマーカーの変異を予測し、単一ターゲットのトランスフォーマーモデルよりも優れた性能を示した。具体的には、AUCに関して、マイクロサテライト不安定性（MSI）検出は単一ターゲットで0.91、マルチターゲットで0.93、BRAF変異検出は単一ターゲットで0.72、マルチターゲットで0.78、KRAS変異検出は単一ターゲットおよびマルチターゲットともに0.65であった。本研究では、大腸がんのHE染色画像から、複数の遺伝子変異およびマイクロサテライト不安定性を同時に予測できることが示された。研究者らは、「今回開発したマルチターゲットモデルは、他のがん種や大規模コホートでの検証を経て、費用対効果の高い遺伝子変異のスクリーニングや診断に活用できる可能性がある」と期待を示した。参照論文： Assessing genotype−phenotype correlations in colorectal cancer with deep learning: a multicentre cohort study 関連記事：組織画像への仮想染色 AIによる新しい大腸がんマーカー大腸がん免疫染色から分子標的薬の効果を予測するAI研究

進行性前立腺がんの予後予測AIモデル：大規模無作為化第三相試験データを用いた外部検証

Kazuyo NAGASHIMA - 2025年9月3日

前立腺がんによる死亡者の大半は、転移性または局所進行性の状態にあるが、これらの患者群に焦点を当てた予後予測AIモデルはまだ実用化されていない。英国、米国、スイスの国際共同研究チームは、進行性前立腺がん患者を対象とした大規模無作為化第三相試験（STAMPEDE試験）のデータを用いて、以前に開発されたマルチモーダルAIモデル「ArteraAI Prostate」の予後予測能力を評価し、その成果をThe Lancet Digital Healthに発表した。研究チームは、STAMPEDE試験で募集されたアンドロゲン遮断療法開始前の転移性および高リスク非転移性前立腺がん患者から採取された病理スライドのライブラリを構築した。この病理組織に加え、年齢、PSA値、がんのステージ分類などの臨床データもアルゴリズムに組み込まれた。2005年から2016年までに112施設から登録された3,167名（非転移性1,575名、転移性1,592名）が解析に含まれ、ArteraAI Prostateの予後予測能力が評価された。その結果、アルゴリズムは前立腺がん特異死亡率と強い相関関係があることが示され（ハザード比1.40）、有用性が確認された。著者らは「生検スライドには進行例でも有用な予後情報が含まれ、MMAIを疾患負荷と組み合わせることで強化治療のかけ過ぎ、かけ足りないを減らせる」とコメントする。将来的には、実臨床において本モデルにより予後良好と判定された患者群に対してはホルモン療法の治療期間を短縮し、一方で予後不良と判定された患者群には治療を強化するなど、個々の患者に応じた治療計画を立てることが可能になると考えられる。参照論文： External validation of a digital pathology-based multimodal artificial intelligence-derived prognostic model in patients with advanced prostate cancer starting long-term...

マルチモーダルAIを利用した膠芽腫の検出

Kazuyo NAGASHIMA - 2025年9月2日

膠芽腫（GBM）は、最も悪性度の高い脳腫瘍であり、AIを用いた診断および予後予測モデルの活躍が期待されている。既存のモデルは単一モダリティに依存しており、GBMの複雑な分子および病理学的構造を十分に捉えることが困難である。このような課題を背景に、シンガポールと台湾の合同研究チームは、MRI、病理組織、オミクスデータなどを統合し、GBMの診断と予後予測を行うビジョントランスフォーマー（ViT）モデルを開発した。 Computerized Medical Imaging and Graphicsに発表された論文によると、研究チームはまず、WHOの脳腫瘍グレードに基づいてMRI FLAIR画像の分類を行うために、ViTのトレーニングを実施した。その結果、ViTは、クラス不均衡に強い評価指標であるマシューズ相関係数0.8951という優れた予測性能を示し、すべてのグレードにおいて高いF1スコアを達成した（Grade2：0.920、Grade3：0.894、Grade4：0.962）。さらに、病理組織画像と26種類の遺伝子情報を含むRNAシークエンスプロファイルを統合した予後予測のためのマルチモーダルモデルを学習・検証したところ、単一モダリティと比較して優れた予測性能を示したという。 ViTは、畳み込みニューラルネットワークとは異なりアテンションメカニズムを適用するため、GBMのような不均一な浸潤性腫瘍の検出に有利であることが示された。今後は、モデル精度の向上を目指し、転移学習や年齢・治療歴などさらに多様なデータの統合、大規模かつ多民族集団での検証が期待される。参照論文： AI-driven multi-modal framework for prognostic modeling in glioblastoma: Enhancing clinical decision support 関連記事：機械学習による脳腫瘍の悪精度判定脳腫瘍DNAを迅速に解析するAIツール脳腫瘍の悪性度をMRI検査画像からAIで予測 – 京大 iCeMs

深層学習アンサンブルモデルを用いたMRI画像による脳腫瘍診断

Kazuyo NAGASHIMA - 2025年8月28日

脳腫瘍は、画像として他の疾患にしばしば類するため、正確かつ早期の診断は依然として大きな課題である。現在、畳み込みニューラルネットワーク（CNN）を用いたモデルが開発されているが、多くのモデルは単一の手法に依存しており、脳腫瘍画像の複雑な構造に十分に対応できていない。こうした課題を踏まえ、合同研究チームはMRI画像を用いた脳腫瘍診断のためのアンサンブルモデルを開発した。 8月8日にScientific Reportsに掲載された研究によると、研究チームはEfficientNetB5、ResNet50、CNNの3つのモデルを組み合わせた新たなアンサンブルモデルを構築した。データセットには、「異常なし」、「グリオーマ」、「髄膜腫」、「下垂体腫瘍」の4つのカテゴリーに分類された2,2000枚以上のMRI画像が含まれている。結果として、MRI画像の全体的な分類正答率は、テストセットで99.4%、検証セットで99.48%、クロスデータセットで99.31%と非常に高いパフォーマンスを示した。さらに、予測の不確実性をエントロピーで評価したところ、0.3093と低い値を示し、診断予測の高い正確性が示唆された。解釈性はGrad-CAM、Guided Grad-CAM、SHAP、SmoothGrad、LIMEで担保している。誤分類の傾向としては、髄膜腫で多くなるという。本アンサンブルモデルは優れた診断精度が期待される一方で、今後は実臨床データを用いたさらなる検証が必要である。また、研究者らは「複雑なアンサンブルモデルであるため、高度なコンピューターリソースが整った環境下でのみトレーニングが可能であり、今後はプルーニング、量子化、知識蒸留などを通じてモデルサイズの軽量化を図る必要がある」と述べている。参照論文： Advanced dynamic ensemble framework with explainability driven insights for precision brain tumor classification across datasets 関連記事：機械学習による脳腫瘍の悪精度判定 MRI画像から脳腫瘍の硬さを自動検出小児脳腫瘍をMRIから分類するAI研究 – 英ウォーリック大学

大規模言語モデルのがん臨床意思決定への応用：システマティックレビュー

Kazuyo NAGASHIMA - 2025年8月26日

がん治療において、大規模言語モデル（LLM）の応用は急速に進展している。米国コーネル大学やマサチューセッツ工科大学の研究チームは、LLMの「がんの臨床意思決定への応用」に関する文献を対象としたシステマティックレビューを実施し、npj Digital Medicineに掲載した。研究者らは、PubMed、Web of Science、Scopus、ACM Digital Libraryを用いて、2024年5月までに発表された大規模言語モデル（LLM）のがんの臨床意思決定への応用に関する論文を網羅的に検索した結果、56件の論文を特定した。レビューの結果によると、55件（98.2%）でChatGPTが使用されていた。分析対象となったがんは、肺がん（11件）、乳がん（8件）、前立腺がん（7件）、子宮頸がん（7件）など、計15種類のがんが含まれていた。がんの意思決定支援の内容としては、治療計画、画像診断、予後や治療後のマネジメント、予防やスクリーニング、患者情報の要約などが含まれていた。治療計画の平均正答率は75.5%に対し、診断は67.4%と低く、研究間のばらつきが目立った。さらに、参加者属性や倫理審査の記載欠落、高所得国への偏在、公開データや評価基準の非標準化が、再現性と臨床適用の障壁となっていた。 LLMは大量の臨床ガイドライン、研究論文、患者情報などを統合し、個々の症例に応じたレコメンデーションを提供することができる。一方で、本レビューではバイアスの存在、実際の患者データの不足、一般化可能性や再現性の問題が課題として明らかにされた。研究者らは「LLMの開発および評価プロセスにおいて、臨床医や患者、その他多様なステークホルダーが参加することで、これらの重要な課題を克服できるだろう」と述べている。参照論文： Large language model integrations in cancer decision-making: a systematic review and meta-analysis 関連記事：大規模言語モデルがEBMを推進する大規模言語モデルによるトリアージプロセスの支援大規模言語モデルを用いた皮膚疾患の診断精度の比較

化学療法誘発性末梢神経障害を予測する深層学習モデル

Kazuyo NAGASHIMA - 2025年8月22日

化学療法誘発性末梢神経障害（CIPN）は、化学療法を受けている患者の30〜40%に発生し、疼痛、感覚異常、運動機能障害など多様な神経症状を引き起こす。症状が重篤な場合には、化学療法の減量や中止を余儀なくされることがあり、その予防および管理は非常に重要である。近年、CIPNを予測するための深層学習モデルの研究が進展しているが、韓国の研究チームはマルチモーダルのトランスフォーマーモデルを用いたCIPN予測モデルを開発し、The Science Partner Journalsに発表した。 8月5日に発表された論文によると、研究チームは2020年から2025年に化学療法を受けた5,276名の患者データ（うちCIPN患者1,892名）を分析した。マルチモーダルのトランスフォーマーモデルは、畳み込みニューラルネットワーク、Long Short-Term Memory（LSTM）、およびXGBoostと比較して優れたパフォーマンスを示し、AUCは0.93、正解率は88.5%、感度は85.3%、特異度は90.1%であった。また、SHapley Additive exPlanations（SHAP）分析の結果、CIPN予測精度に寄与する重要な特徴量として、抗がん剤投与量（SHAP値=0.52）、末梢神経MRIの異常（SHAP値=0.41）、心電図異常（SHAP値=0.38）、CYP2C8遺伝子変異（SHAP値=0.34）、および糖尿病（SHAP値=0.31）が特定された。今回の研究結果は、マルチモーダルのトランスフォーマーモデルがCIPNの高リスク患者を早期に特定するのに寄与し、臨床医が抗がん剤の投与量を含むがん患者の治療計画の立案に役立つ可能性を示しており、今後の前向き臨床試験におけるモデルの検証が期待される。参照論文： Predicting Chemotherapy-Induced Peripheral Neuropathy Using Transformer-Based Multimodal Deep Learning 関連記事：白血病治療薬の合併症予測AI Curate.AI -「抗がん剤投与量の減量と治療効果の最適化」を目指すAIツール頭頸部がんの治療強度を下げるためのAI利用

AIが薬の化学構造から薬物有害反応を予測

Y Global - 2025年8月14日

医薬品の副作用（ADR）は世界的に入院や治療中断の大きな要因だが、従来手法ではまれ・遅発性の有害事象を見逃しやすい。そこでソフィア医科大学の研究チームは、薬の化学構造だけからADR発生確率を予測する機械学習モデルを開発し、Pharmacia誌で報告した。医薬品の副作用や有害事象などの情報データベースであるDrugBank、MedDRA、SIDERのデータを統合し機械学習モデルに学習させ、入力には分子構造を表すSMILESから導いた特徴量を使用した。対象とする副作用は肝毒性、腎毒性、心毒性、神経毒性、高血圧、光線過敏の6種類とし、既知薬と未学習薬で検証した。結果、全体として一貫した性能を示し、例えばエリスロマイシンの肝毒性を高確率で的中させた。一方でシスプラチンは高血圧を正しく示唆したものの、腎毒性を過小評価し光線過敏を過大評価するなど、学習データの偏りや構造の特殊性に伴う限界も見られた。研究チームは「AIは従来手法の代替ではなく補完であり、前臨床段階のふるい落とし、個別化安全性評価、規制当局の迅速対応に資する」とコメントしている。今後は化合物・ADRの多様性拡充、薬物動態や用量、相互作用、電子カルテデータ等の実臨床データ統合、説明可能性（SHAP等）の強化を進めるとのことだ。参照論文： In situ development of an artificial intelligence (AI) model for early detection of adverse drug reactions (ADRs) to ensure drug safety 関連記事： AIが既存薬から新たな脂質低下作用を発見 LLMのハルシネーションが新薬開発の手がかりとなり得る機械学習により創薬スクリーニングを10倍高速化

5年以内の乳がん発生リスクを予想するAI – ワシントン大学

Y Global - 2025年8月12日

マンモグラフィ画像だけで女性の5年以内の乳がん発症リスクを算出するAI「Prognosia Breast」がFDAのブレークスルー機器指定を取得した。従来の質問票ベース予測は精度が低く、早期発見の妨げとなっていたが、ワシントン大学医学部の研究チームは画像解析と年齢情報のみで従来手法の2.2倍の精度を実現し、全国ガイドラインと整合する「絶対リスク」を提示できる点が評価された。 Progmosia Breastは2Ｄマンモグラフィと3Ｄトモシンセシスの両方に対応し、既存の読影ワークフローへシームレスに組み込める設計となっている。数万例の過去画像から機械学習で微細な前がん兆候を検出し、乳がんリスクが3％以上の女性を抽出して追加検査や予防療法へ誘導する。乳がん検査はインフラが既に全米で整備され、米国女性の75％以上が定期撮影を受けているにも関わらず、乳がんの発見が遅れるケースが34％もあるのが現状だが、本AIはこの状況を改善し得る。試算では、画像取得時に本AIで追加解析するだけで、MRI検査やタモキシフェン投与など個別のリスク低減策を早期に提案可能となる。開発者のグラハム・コールディッツ医師は「世界中どこで受診しても均質なリスク予測を提供し、乳がん予防を一変させる」と強調。2024年設立の企業Prognosiaは多施設共同試験を推進し、リスクスコアを用いた臨床試験を予定。AIと既存検診を融合したハイブリッド診療が、乳がん死亡率を一段と引き下げる未来を拓こうとしている。関連記事：浸潤性乳管がんの遠隔転移リスクを予測するAI 乳がん病理画像から「HER2発現の有無」を予測するAI 乳がん早期発見のための新しい血液検査

AIが既存薬から新たな脂質低下作用を発見

Y Global - 2025年8月5日

中国の研究チームが、人工知能（AI）を活用し、既にFDAの承認を受けている医薬品から想定していなかった脂質低下効果を発見した。本研究はActa Pharmacologica Sinica誌に掲載されており、スタチンなど標準治療に対する忍容性の低さや効果不十分に悩む高脂血症患者の「治療ギャップ」を埋める手がかりとなり得る。研究チームは既知の脂質低下薬176種と非脂質低下薬3,254種、計3,430種の既知薬をデータ化し、68通りの機械学習モデルを競わせて性能を比較した。最上位10モデルの多数決で29薬を候補に絞り込んだ。その後、1998〜2024年の電子カルテによる後ろ向き解析で4薬（アルガトロバン、レボキシル（レボチロキシン）、オセルタミビル、チアミン）が実際にLDLと総コレステロールを有意に低下させることを確認した。さらにマウス実験、そして分子ドッキング解析という厳格な多層検証を経て裏付けられた。「私たちはAI駆動型のドラッグリポジショニングという新しいパラダイムを確立した」と筆頭著者のPeng Luo氏は述べている。既存薬は安全性データと製造体制が整っているため、再定位が成功すれば即座に臨床試験へ進めるのが強みだ。AI創薬×リアルワールドデータという新しいパラダイムは、高脂血症のみならず糖尿病や認知症など複合疾患にも応用可能であり、「薬の地図」を塗り替える革新になるかもしれない。参照論文： Integration of machine learning and experimental validation reveals new lipid-lowering drug candidates 関連記事： LLMのハルシネーションが新薬開発の手がかりとなり得る機械学習により創薬スクリーニングを10倍高速化 AI創薬の支援プラットフォーム

血液透析患者の死亡リスクを予測する機械学習モデル

Kazuyo NAGASHIMA - 2025年7月29日

透析療法を受けている患者は、一般集団と比較して死亡リスクが著しく高く、死亡リスク要因の把握は早期介入のために重要である。中国の研究チームは、血液透析患者における死亡リスクを予測する機械学習モデルを構築し、その研究成果をfrontiersに発表した。研究チームは、2021年から2024年の間に武漢中央病院透析センターで血液透析を受けた512名（生存群300人、死亡群212人）のデータをレトロスペクティブに解析した。ロジスティック回帰、ランダムフォレスト、K近傍法、サポートベクターマシン、XGBoostの5つの機械学習モデルを訓練した結果、K近傍法が最も高いパフォーマンスを示した（AUC0.9792）。SHapley Additive exPlanations分析（SHAP分析）によると、血液透析患者の死亡予測に寄与する特徴量として、透析導入年齢、クレアチニン値、白血球分画、血中リン濃度、非抱合型鉄が重要であることが明らかになった。本研究により、K近傍法を用いたアルゴリズムが高リスク血液透析患者の死亡率低下に寄与する可能性が示された。研究チームは、「今後は多施設での大規模サンプルを用いた前向きコホート研究を実施し、一般化可能性と外的妥当性を検証する必要がある」と述べている。参照論文： SHAP combined with machine learning to predict mortality risk in maintenance hemodialysis patients: a retrospective study 関連記事： AIは腎臓病と透析導入を予防できるか？慢性腎臓病（CKD）の重要リスク因子に「教育水準」病理画像から腎臓の線維化を評価するAI研究

院内における菌血症発症の予測モデル

Kazuyo NAGASHIMA - 2025年7月28日

院内発症の菌血症や真菌菌血症（Hospital-onset bacteremia and fungemia：HOB）の発症原因は複雑であるが、過去の研究では主に患者の特性に焦点が当てられていた。ワシントン大学の研究チームは、患者の特性以外の要因を考慮したHOB発症の予測に関する機械学習モデルを開発し、JAMA Network Openに発表した。本研究は、2021年に入院した52,442名の患者を対象とした。そのうち34,885名が72時間以上の入院期間を有しており、556名がHOBを発症した。研究チームは、XGBoostを用いてHOB発症の予測能力を、患者の特性のみに基づく場合と、患者特性に加えてその他の要因も含めた場合に分けて比較した。患者以外の要因としては、入院前の救急外来での待機時間、HOB発症の7日前に接触した医療従事者の数、同室に抗緑膿菌作用のあるβラクタム薬を投与されていた患者の有無などが考慮された。その結果、患者以外の要因を加味したモデル（AUC 0.88）は、患者の特性のみに基づくモデル（AUC 0.85）よりも優れた予測能力を示した。SHapley Additive exPlanations（SHAP）分析によると、最も重要な特徴量として、患者特性のみに基づくモデルでは抗緑膿菌作用のあるβラクタム薬の投与が挙げられ、患者以外の要因を加味したモデルではHOB発症以前のICU滞在期間が長いことや医療従事者との接触人数が多いことが挙げられた。本研究では、患者特性以外の要因もモデルの変数に組み入れることで、HOB発症の予測精度が向上することが示された。研究チームは「広域スペクトラムの抗生物質は、HOB発症のリスクを高める可能性があるため、投与を慎重に検討すべきである」と強調した。参照論文： Integrating Nonindividual Patient Features in Machine Learning Models of Hospital-Onset Bacteremia 関連記事：菌血症診断はAIの時代へ？早期介入を可能に侵襲性カンジダ感染症の死亡リスク因子を特定する機械学習研究血液感染の重症化を識別するAI技術

うつ病患者に対するVRを用いた運動療法：ランダム化比較試験

Kazuyo NAGASHIMA - 2025年7月25日

適度な運動は、うつ病の症状の軽減に役立つとされていているが、運動療法を実施する際には、その継続性が課題となる。バーチャルリアリティ（VR）を用いることで、モチベーションの向上や多様な運動環境の提供につながり、運動療法の継続に寄与することが報告されている。中国の研究チームは、うつ病の成人患者を対象に、VRを用いたサイクリングマシンによる運動効果について、ランダム化二重盲検試験を実施し、その結果をJournal of Medical Internet Researchに発表した。研究チームによると、2023年から2024年の間に、外来受診によりうつ病と診断された114名の患者が登録され、VRを用いたサイクリングマシンの高強度の運動、中等度の運動、VRを用いない中等度の運動の3群に無作為に割り付けられた。うつ病の重症度評価はハミルトンうつ病評価尺度（HAM-D）を用いて行われ、運動療法の介入後に12週間のフォローアップが実施された。各群の寛解率は、VRを用いた高強度群で74%、VRを用いた中等度群で74%、VRを用いない中等度群で40%と、VR実施群でよりうつ病症状の改善がみられた。2つのVR実施群におけるうつ病症状の改善には有意差は見られなかったが、中等度群の方が高強度群よりも患者の満足度が高い結果となり、適度な楽しさが治療継続に寄与することが示唆された。研究チームは、「VRの使用により、運動の楽しさを追求できることが運動療法のアドヒアランス向上につながる。今後は、治療効果の判定をより適切に行うために、非運動群との比較が必要である」と述べている。参照論文： Stationary Cycling Exercise With Virtual Reality to Reduce Depressive Symptoms Among People With Mild to Moderate Depression: Randomized Controlled Trial 関連記事： VR先進的な医療応用中国のメンタルヘルスケア...

英バイオバンク、世界最大の全身画像データベースが完成

Y Global - 2025年7月24日

UK Biobankは、心疾患や認知症、がんなど、重大な疾患の早期診断につながる世界最大規模の全身画像データベースを完成させた。6,000万ポンドを超える投資がされた本プロジェクトでは、英国全土の10万人のボランティアの脳や心臓、腹部、血管、骨、関節などを網羅的に撮影して得られた10億枚以上の画像と、ゲノム、血液、ライフログを統合し、病気が「いつ・なぜ・どのように」起こるかを可視化して早期介入を狙う取り組みで、すでに1,300本以上の査読論文が発表され、臨床現場に成果が現れ始めている。具体的には、参加者一人につき約5時間でMRI・DEXA・超音波など計1.2万枚の画像を取得し、総計10億枚超の匿名画像を、血液や遺伝子、生活習慣に関する詳細なデータとともにクラウド上で管理、提供している。これらの豊富なデータを活用したAI研究の成果が次々と生み出されており、例えば、心疾患を早期に予測する技術や、MRIを用いて非侵襲的に脂肪肝を診断する手法が開発され、アルツハイマー病やパーキンソン病を早期に予測する研究も進展している。さらに、肥満の遺伝的リスクや脳の萎縮と飲酒量の関係性など、新たな健康リスク因子も次々に明らかになっている。研究者らは、前例のない規模の画像データにより、人体の仕組みや病気の発症メカニズムの理解が劇的に進展すると期待を寄せている。UK Biobankのデータは、安全なクラウドベースの研究分析プラットフォーム（UKB-RAP）を通じて、承認された研究者に段階的に公開される予定である。関連記事：米国心臓協会が「患者データ共有」のガイダンスを発表英バイオバンク研究 – 飲酒が増えると脳が減る UCLA「MOVER」 – AI研究推進のための大規模手術室データベースを公開

冠動脈造影に基づく経皮的冠動脈インターベンションの成功予測を行うAI

Kazuyo NAGASHIMA - 2025年7月23日

経皮的冠動脈インターベンション（PCI）において、冠動脈に中等度から重度の石灰化病変（MSCAC）がある場合、治療の成功率が低下する傾向がある。冠動脈造影（CAG）によって、PCI手技の難易度を評価することは重要であるが、CAGの結果に基づいてPCIの成功率を予測した研究は少数である。中国の研究チームは、機械学習技術を用いて、MSCACを有する患者のCAGの特徴からPCIの結果を予測する研究をJournal of Medical Internet Researchに発表した。本論文によると、研究チームは2017年から2018年の間にPCIを受けたMSCACを有する患者3,271名と、冠動脈石灰化がないまたは軽度の患者17,998名を対象とした。CAGの特徴に基づいてPCIの成功を予測するために、内部検証コホートにおいて6つの機械学習モデルが検証された。その結果、XGBoostが最も優れたパフォーマンスを示し（AUC0.984、平均適合率0.986、F1スコア0.970、幾何平均 0.979）、最も効果的なモデルとなった。また、SHapley Additive exPlanations分析によると、PCI成功予測に最も寄与するCAGの特徴として、病変の長さ、最小血管内腔径、TIMI分類（Thrombolysis in Myocardial Infarction grade）による血流評価、慢性完全閉塞、対照血管径（病変前後の健康な血管径）、広範囲病変の6つの特徴量が特定された。研究者たちは、「この機械学習モデルを用いることで、患者のPCI成功率が低いと予測された場合、医師は患者およびその家族に対して、PCIに伴うリスクを事前に説明することができる」と述べている。今後は、畳み込みニューラルネットワークなどの深層学習技術を活用することで、CAGのさらなる多様な特徴を分析できるようになることが期待される。参照論文： Prediction of Percutaneous Coronary Intervention Success in Patients With Moderate to Severe Coronary...

123...5 ページ％CURRENT_PAGE％の％TOTAL_PAGES％

年間アーカイブ 2025

最新の記事

注目の記事

注目の記事

最新の記事