2025 | 医療とAIのニュース・最新記事 - The Medical AI Times

医療とAIのニュース 2025

血液から脳腫瘍の有無を予測するAI研究

Y Global - 2025年5月7日

米ジョンズ・ホプキンス大学を中心とする多施設研究チームは、血液中のセルフリーDNA（cfDNA）の断片化パターンを用いて脳腫瘍の非侵襲的診断を可能にする新しい機械学習アルゴリズム「ARTEMIS-DELFI」を開発した。この手法は、従来の遺伝子変異ベースのリキッドバイオプシーが困難だった脳腫瘍に対して、感度の高い検出を実現するもので、学術誌「Cancer Discovery」にて発表されている。本研究では、脳腫瘍患者148名と健常者357名から血液を採取し、血漿中のcfDNAを解析対象とした。2つの解析技術「DELFI（DNA断片の分布を解析）」と「ARTEMIS（リピート配列のパターンを解析）」を組み合わせた機械学習アルゴリズム「ARTEMIS-DELFI」に、cfDNAの断片の長さ、分布、遺伝子のコピー数の変化、エピジェネティックな修飾情報など、さまざまな特徴を機械学習モデルに学習させ、がんの有無を判別させた。その結果、全グレードの脳腫瘍に対してAUC0.90という高い予測精度を達成し、ポーランドの独立コホートでもその有効性を確認した。これは、ARTEMIS-DELFIが既存の遺伝子変異検出法よりも10倍以上の検出力であることを示しており、さらに直径2cm以下の小型腫瘍でも有効であることが確認された。加えて、血漿中cfDNAの解析から、腫瘍由来DNAと免疫細胞（特にT細胞）のアポトーシスが反映されていることも明らかにされた。研究者らは「ARTEMIS-DELFIは高い感度と特異度を両立する非侵襲的手法として、救急外来やプライマリケアでの初期スクリーニングに有用」としており、次のステップとして脳腫瘍のリスクが高いより大規模な患者集団を対象に前向き試験を設計すると述べている。参照論文： Detection of brain cancer using genome-wide cell-free DNA fragmentomes 関連記事：転移性脳腫瘍の原発巣同定を行う機械学習モデル機械学習による脳腫瘍の悪精度判定脳腫瘍DNAを迅速に解析するAIツール

気象データから急性虚血性脳卒中の発症数を予測するAI研究

Y Global - 2025年5月2日

気候変動の進行に伴う健康リスクの増加が問題視されており、その対応が求められている。特に急性虚血性脳卒中（AIS）は気象情報が発症に関与することが知られている。ドイツ・マンハイム大学病院を中心とした研究チームはこのほど、気象データを活用してAISの発症数を予測する機械学習モデルを構築した。研究成果は学術誌「NPJ Digital Medicine」にて発表されている。本研究では、2015年から2021年にかけての約8,000件のAIS入院データと気象観測データを組み合わせ、日次単位での発症予測を試みた。気温・気圧・風速など133項目の気象データを特徴量として、XGBoostやランダムフォレストなどのモデルを構築。その結果、XGBoostが最も高い予測精度を示し、ほぼ誤差なく予測できたという（平均絶対誤差：1.21件/日）。特に、高気圧下や寒冷ストレスが持続する日、強風が吹く日などにAIS発症数が増加する傾向が認められた。また、SHAP解析により、予測に寄与する気象因子の可視化と解釈も可能となっている。急性脳梗塞は治療の時間依存性が極めて高い疾患であり、事前に入院需要を予測することは、病院の人員配置や患者搬送の最適化につながる。研究チームは「本手法は軽量な計算資源でも動作するため、将来的には気象予測モデルと連携したリアルタイムの発症リスク通知や、ハイリスク患者への予防的介入への活用を視野に入れている」と述べている。参照論文： Machine learning-based forecasting of daily acute ischemic stroke admissions using weather data 関連記事：英政府 – 2100万ポンドで脳卒中AIを全面導入機械学習ツールによる脳卒中診断の高度化 NHSの脳卒中ケアに革新をもたらすAI

Googleの医療AI「AMIE」が優れた鑑別診断をアシスト

R.A. - 2025年4月30日

近年の大規模言語モデル（LLM）の進歩は著しく、医師国家試験に合格するAIや対話型AIなど多岐にわたる能力を発揮している。Google関連企業の研究チームはこのほど、診断推論に最適化した大規模言語モデルAMIE（Articulate Medical Intelligence Explorer）が、臨床医の診断推論の精度を向上させることを発表した。 Natureに掲載された本研究では、NEJMのCPCに掲載されたケースレポート302件に対し、AMIEが単独で鑑別診断リストを挙げる能力と臨床医を支援するツールとしての能力の両方を評価した。AMIEは、GoogleのPaLM2を基盤モデルとし、様々なMedQA、独自の医療面接会話データ、MIMIC-Ⅲの電子カルテ要約を用いて、ファインチューニングされたモデルである（よって本評価指標は学習に用いられていない）。鑑別診断リストについて、医師による鑑別診断の質の評価（鑑別リストに正解となる診断または近しい診断が入っているか）および「ground truth 診断」との一致率による評価を行ったところ、AMIE単独の性能は臨床医を大きく上回り、10の鑑別診断を挙げるタスクでは、臨床医の正答率が33.6％、AMIEが59.1％という結果を得た。また、臨床医支援の点では、AMIEを支援ツールに用いた臨床医の正答率が51.7％、AMIE以外の検索ツールを用いた臨床医で44.4％と、AMIEは臨床医の診断能力向上に寄与する結果となった。一方、AMIEを導入してもタスクにかかる時間にはほとんど影響がなく、従来の検索手段と同等の操作性であることも担保されている。研究チームは「AMIEの弱みは、全体を俯瞰するよりも、特徴的なキーワードや所見など、個別の症状にフォーカスする傾向があることである。他のAIにも散見される傾向であり、その点で複雑な症例を扱うNEJM-CPCはLLM評価の有用なベンチマークとなりうる」と述べている。今後はマルチモーダル入力への対応、ハルシネーションの改善といった検討を進めることとなる。参照論文：Towards accurate differential diagnosis with large language models 関連記事：1.Google – 医療面接のためのAIベース診断対話システム2.生成AIと医師の診断精度を比較：システマティックレビュー&メタアナリシス3.医療LLMに潜む社会的バイアス

口腔がん・中咽頭がんの放射線治療中における急性疼痛とオピオイド投与量を予測する機械学習モデル

Kazuyo NAGASHIMA - 2025年4月28日

大半の中咽頭がん患者は、放射線治療中にオピオイドの投与を必要とするが、オピオイドの漫然とした長期投与は、依存や慢性疼痛のリスクを高める。米国テキサス州のMDアンダーソンがんセンターの研究チームは、放射線治療中の口腔がんおよび中咽頭がん患者における疼痛の程度、オピオイド投与量（MEED）、および鎮痛効果を予測する機械学習モデルを開発した。本研究は、Frontiersに掲載されている。研究チームによると、本研究は2017年から2023年の間に、MDアンダーソンがんセンターで放射線治療を受けた口腔がんおよび中咽頭がん患者900人を対象に実施されたという。ロジスティック回帰（LR）、サポートベクターマシン（SVM）、ランダムフォレスト（RF）、勾配ブースティングマシン（GBM）の4つのモデルについて学習を行った結果、疼痛の程度の予測ではGBMが（AUROC：0.71、再現率：0.39、F1スコア：0.48）、総MEEDの予測ではLRが（AUROC：0.67）、他のモデルを上回る識別性能を示した。鎮痛効果の予測に関しては、識別性能に有意差は見られなかった。また、疼痛の程度とMEED予測に最も関連のある変数となったのが、「放射線治療前の疼痛スコア」、「体重の変化」、「心拍数の変化」、「年齢」などであった。臨床医が個人の経験に基づいて疼痛の程度を予測することは現状では困難である。著者らは、「本モデルにより、個々の患者に応じた疼痛管理計画が可能となり、ひいてはオピオイドの漫然とした長期投与や依存リスクを抑えることができる」と述べている。参照論文：Machine learning predicting acute pain and opioid dose in radiation treated oropharyngeal cancer patients 関連記事：1. オピオイド処方後の有害事象発現を予測2. シンプルで実用性の高い「オピオイドリスク予測モデル」3. スタンフォード研究 – 手術後の長期オピオイド使用を予測する機械学習アルゴリズム

関節リウマチにおけるうつ病を予測する機械学習アルゴリズム

Kazuyo NAGASHIMA - 2025年4月25日

関節リウマチ（RA）は、一般集団と比較してうつ病の有病率が約2倍高いが、医療資源の制約や偏見により、うつ病の併発が見逃されることがある。このような課題を背景に、モロッコの研究チームは「RA患者のうつ病を予測するための機械学習モデル」を構築した。 Cureusから発表された研究論文によると、本横断的研究はモロッコのフェズにあるHassan II大学病院のリウマチ科において、112名のRA患者を対象に実施されたという。うつ病の評価には、身体疾患を併存する患者における抑うつ状態の評価ツールであるHospital Anxiety and Depression Scale（HADS）が使用された。収集された変数には、年齢・性別・居住環境などの社会人口統計情報、RAの罹病期間・関節所見などの臨床データ、CRP・ESR・RF・ACPA・HAQ-DI・DAS28などの生物学的指標、メトトレキサートや生物学的製剤を含む各種治療歴などが含まれた。研究チームは、サポートベクターマシン、ランダムフォレスト、決定木、ロジスティック回帰（LR）、勾配ブースティングの5つの機械学習モデルについて上記変数から学習を行い、RAにおけるうつ病発症の予測能力を検証した。その結果、LRが最も優れたパフォーマンスを示し（正答率76.5％、適合率72.2％、再現率81.2％、F1スコア0.765、AUC0.767）、他のモデルを上回る結果となった。本研究で構築されたAIモデルにより、RA患者におけるうつ病リスクを早期に特定することが可能となる。研究チームは、「今後は本AIモデルをモバイルアプリケーションに統合し、RA患者に対するうつ病へのタイムリーな介入を目指す」と述べている。参照論文：A Machine Learning Model for Predicting Depression in Moroccan Rheumatoid Arthritis Patients 関連記事：関節リウマチの早期診断AI うつ病自動診断ツールのレビュー論文産後うつ病を予測する機械学習アルゴリズム

医療LLMに潜む社会的バイアス

Daiju Ueda - 2025年4月22日

Nature Medicineに掲載された研究によれば、大規模言語モデル（LLM）が救急外来の症例を判断する際、患者の人種や社会的地位などに基づくバイアスが生じる可能性があり、LLMが特定の集団に対して不均衡な検査や治療方針を推奨する傾向が確認された。本研究は米マウントサイナイ医科大学の研究チームによりNature Medicineで公開されている。対象となったのは1,000例（実症例500例と合成症例500例）の救急外来の症例である。各症例は様々な社会人口統計学的変数を付与した計32通り（人種、ホームレス状態、性的指向、所得水準などの属性を付加した場合と、属性を付さない対照群）に変換され、9種類のLLM（GPT-4oなど）に4つの臨床判断（トリアージ優先度、追加検査の種類、入院の必要性、メンタルヘルス評価の要否）を問い、医師による判断結果と比較した。その結果、黒人やホームレス、LGBTQIA+と表示されたケースでは対照群よりも緊急度や侵襲的治療の推奨が有意に高まり、メンタルヘルス評価が6〜7倍多く指示される例もあった。また、高所得とラベル付けされた患者にはCTやMRIなどの高度画像検査が有意に多く（P<0.001）推奨される一方、中低所得とラベル付けされた患者には検査不要、もしくは限定的な検査にとどまる傾向が認められた。これらの差異は、実際の医師が示した基準や臨床ガイドラインとは必ずしも一致せず、トリアージや検査方針が属性情報に過度に左右されている可能性が示唆される。研究者らは、LLMが学習過程で含んだ社会的偏見が医療の場でも再現される危険性を指摘している。今後は属性情報の提示方法やモデルの学習データの改善など、多角的な対策によって公平かつ患者中心の医療支援を実現していく必要があると述べている。参照論文：Sociodemographic biases in medical decision making by large language models 関連記事：1. 胸部X線AIモデルが示す人種間と性別間のバイアス2. 医療画像処理AI開発における「29の潜在的バイアス」3. 生成AIと医師の診断精度を比較：システマティックレビュー&メタアナリシス

AIを応用した体外受精における男性不妊マネジメント：システマティックレビュー

Kazuyo NAGASHIMA - 2025年4月17日

不妊症において、男性不妊は不妊症症例の20%から30%を占めている。精液検査は基本的な男性不妊の検査であるが、主観に基づく手動による評価方法であり、体外受精（IVF）の結果を正確かつ効率的に予測することが困難である。このような課題を踏まえ、イランの研究チームは体外受精における男性不妊のマネジメントに関するAIのレビューを行い、その成果をEuropean Journal of Medical Researchに発表した。研究チームは、2024年までに発表された研究について、「IVF」、「AI」、「精液検査」などのキーワードを用いて、Pubmed、Scopus、IEEE、Web of Scienceで文献検索を行い、14件の研究を分析対象とした。研究の約60%が2021年以降に発表されたものだった。AIモデルとしては、サポートベクターマシン、多層パーセプトロン、勾配ブースティング決定木、ランダムフォレストなどが採用されており、これらは精子の濃度や運動率に基づく分類（AUC88.59%）、体外受精の成功予測（AUC84.23%）、非閉塞性無精子症における精子採取の成功率（AUC80.7%）、精子DNA断片化の評価、精巣静脈瘤の診断および分類の評価などに利用されていた。本レビューは、AIにより精液検査の評価や体外受精の結果予測が最適化される可能性を示した。研究者たちは、「精液検査は手動で行うため、評価者間で結果にばらつきが生じやすい。しかし、AIを導入することで検査結果の再現性が保たれ、客観的な評価が可能となる。AIの実用化には、データ収集のための標準化されたプロトコールの策定が必要である」と述べている。参照論文：Artificial intelligence (AI) approaches to male infertility in IVF: a mapping review 関連記事：1. 精索静脈瘤による男性不妊を予測するニューラルネットワーク2. Fairtility社 – 体外受精成功率向上を図る受精胚選別AI3. 精子の細胞内pHから「体外受精の成功」を予測する機械学習アルゴリズム

術後急性腎障害を予測するAI

Kazuyo NAGASHIMA - 2025年4月16日

術後の急性腎障害（AKI）は、入院中の死亡率を約3倍から9倍に高める重大な合併症であり、AKIの予測と予防的介入が重要である。いくつかの術後AKIのリスク評価ツールが発表されているが、少数の施設での研究に基づくため、精度には限界がある。こうした課題を受けて、韓国の研究チームは多施設コホート研究により機械学習を用いた術後AKIのリスク予測モデルを構築し、その成果をJournal of Medical Internet Researchに発表した。研究チームは、2009〜2019年までに韓国カトリック大学関連の7つの大学病院にて全身麻酔下に行われた手術239,267件（術後AKI症例は7,935件）を対象に、ディープニューラルネットワーク（DNN）、ロジスティック回帰、決定木、ランダムフォレスト、LightGBM、ナイーブベイズの6つの機械学習モデルにおいて学習を行い、術後AKIの予測能力を検証した。モデルの学習に使用された変数は最大38個で、患者属性や手術情報、血液検査の結果がなど含まれていた。その結果、LightGBM（AUC=0.836）、DNN（AUC=0.832）、ロジスティック回帰（AUC=0.825）が優れたパフォーマンスを示し、38個の変数すべてを組み込んだ場合に最も高い性能を発揮した。術後AKIのリスクを予測する本モデルは、これまでの研究と比較して大規模多施設のデータセットを用いて多数の機械学習手法を比較した点に強みがある。研究者たちは、「本モデルの一般化性能を検証するためには、外部検証を行う必要がある」と述べている。参照論文：A Risk Prediction Model (CMC-AKIX) for Postoperative Acute Kidney Injury Using Machine Learning: Algorithm Development and Validation 関連記事：1. 急性腎障害の早期予測AIモデル2. 連続尿量と腹腔内圧から急性腎障害を予測3. 整形外科手術後の急性腎不全を予測するAI研究

癌の画像診断における進歩：アンブレラレビュー

Kazuyo NAGASHIMA - 2025年4月14日

過去10年間で、AIは画像診断において大きな進歩を遂げ、複雑なデータをより適切に解釈できるようになったが、これは癌の画像診断においても例外ではない。中国の研究チームは、癌の画像診断におけるAIモデルのパフォーマンスについてアンブレラレビューを実施し、その結果をJournal of Medical Internet Researchに発表した。研究チームは、2024年までに発表されたAIによる非侵襲的画像診断の性能を検証したシステマティックレビューおよびメタアナリシスについて、PubMed、Embase、Web of Science、Cochrane、IEEEのデータベースを検索し、158件の論文を分析対象とした。80％以上の研究が2021年以降に公表されていた。癌の種類の内訳は、消化器系43件、女性器系23件、頭頸部系18件、呼吸器系16件、泌尿器系18件、皮膚系18件、中枢神経系15件であった。最も使用されていたAIモデルは、畳み込みニューラルネットワークとサポートベクターマシンであり、その他にもDenseNet、EfficientNet、RetinaNet、ImageNet、Inception-v3など多岐にわたった。内部検証と外部検証の両方が行われていたレビューは49件であった。 AIは、画像診断をはじめ、癌のクラスや病期分類の評価、さらには予後予測など、癌診療において大きな進歩をもたらした。その一方で、データの品質、システムの透明性、倫理的および法的問題など、いくつかの課題も残されている。研究者たちは、「AIを実際の医療サービスの向上に結びつけるためには、研究者、臨床医、政策立案者の連携が不可欠である」と述べている。参照論文：Artificial Intelligence Performance in Image-Based Cancer Identification: Umbrella Review of Systematic Reviews 関連記事： AIによる肝細胞がんの予後予測 – システマティックレビュー機械学習と深層学習を用いた神経膠芽腫患者の生存予測：システマティックレビューレビュー論文 ― 腫瘍学におけるAI利用

AIによる心臓弁膜症・逆流症の評価とリスク層別化：DELINEATE-Regurgitation研究

R.A. - 2025年4月10日

弁膜症の一つである閉鎖不全症/逆流症は、診断の複雑さと患者の転帰への影響から、正確な診断および重症度判定が必要とされるが、その精度には現状ばらつきがある。この課題に対し、米コロンビア大学アービング医療センターらの研究チームは、経胸壁心エコー（TTE）画像を用いた深層学習システムで、逆流症の分類および僧帽弁逆流症（MR）の進行リスクの層別化が良好に行えるとの研究成果を発表した。本研究はEuropean Heart Journalに掲載されている。本研究では、71,660件のTTE検査から得た1,203,980件のカラードプラ動画を用いて、時空間畳み込みニューラルネットワーク（Spatiotemporal Convolutional Neural Networks）の学習を行った。まず逆流症の分類予測において最適な動画抽出法を検討した結果、「単一ビューよりも複数ビュー」を用いて、「重度の逆流を示唆する上位3動画より、全動画について各々行った予測に動的な重み付けをして統合する」方が、総じて精度が高いことが明らかとなった。特に三尖弁逆流症においては、複数ビューによる精度向上が顕著であった。また、別のタスクとして、僧帽弁逆流症患者における2年以内の疾患進行リスク予測を行ったところ、正確なリスク層別化が可能であることが示された。本研究で作成したDELINEATE-MR-Progressionモデルによるリスクスコアに関して、内部テストセットのハザード比は4.1、外部テストセットでは2.1となった。研究チームは「本モデルで各患者の進行リスクを予測することで、心エコー検査の間隔に関する臨床意思決定支援に役立てることが出来る。例えば、フォローアップの頻度を個別化することが可能となるだろう。また、近年研究が進むAIエコーと組み合わせることで、一貫した検査を実現したい」と述べている。参照論文：Deep learning for echocardiographic assessment and risk stratification of aortic, mitral, and tricuspid regurgitation: the DELINEATE-Regurgitation study 関連記事：1. AIによる大動脈弁石灰化の自動定量2. 心臓弁膜症の検出を自動化3....

緑内障の進行予測を行うAI

Kazuyo NAGASHIMA - 2025年4月9日

緑内障は、眼圧の上昇などが原因で視神経が障害され、不可逆的な失明を引き起こすため、患者の生活の質（QoL）を著しく低下させる。一部の患者では症状が進行し、手術が必要となることがあるが、米スタンフォード大学の研究チームは、電子カルテ上の患者の臨床情報（EHR）と網膜神経線維層の光干渉断層計（OCT）画像を用いて、手術が必要となるリスクが高い患者を予測するAIモデルを開発し、その成果をTranslational vision science and technologyに発表した。研究チームは、2008年から2023年の間に受診した緑内障患者1,472名を同定し、トレーニングセット（972名、66％）と検証セット（250名、17％）にランダムに割り当てた。TabNetとXGBoostを用いて、EHRまたはOCT画像のいずれかを入力する単一モデル、およびEHRとOCT画像の両方を入力する融合モデルを訓練した。その結果、TabNet融合モデルはテストセットにおいてROC 0.832を達成し、XGBoost融合モデル（ROC 0.747）と比較して、優れたパフォーマンスを示した。 EHRのみのモデルでは、TabNetがROC 0.764、XGBoostがROC0.720を示した。一方、OCT画像のみのモデルでは、TabNetとXGBoostでそれぞれ0.624および0.633を示した。総合的に見て、TabNetはXGBoostを上回り、さらに複数のデータを統合することでより優れたパフォーマンスを発揮することが示された。著者らは「視野検査など、さらに多くのデータを統合することで予測モデルを強化できる可能性がある」と述べている。参照論文：Multimodal Artificial Intelligence Models Predicting Glaucoma Progression Using Electronic Health Records and Retinal Nerve Fiber...

MRI画像を用いて変形性頸椎症を予測するAIモデル

Kazuyo NAGASHIMA - 2025年4月7日

変形性頸椎症（DCM）は、高齢者に広く見られる疾患であり、頚椎の骨や椎間板の変性によって脊髄や神経根が圧迫され、さまざまな神経症状を引き起こす。韓国の研究チームは、矢状断T2強調MRI画像を用いてDCMを予測する深層学習モデルを開発し、その成果をSkeletal Radiologyに発表した。先行研究は、数十人から数百人程度の小規模なコホートに基づいており、その結果の一般化には限界があったが、今回はその5倍から10倍の規模のコホートを確立し、モデルのパフォーマンス向上を目指した。研究チームは、2007年から2022年までに撮影されたDCM患者7,645名の矢状断T2強調MRI画像を、トレーニングセット（6,880名）とテストセット（765名）にランダムに分類した。ResNet50、VGG16、MobileNetV3、EfficientNetV2などの事前にトレーニングされた畳み込みニューラルネットワークに転移学習を応用し、アンサンブルモデルを構築した。その結果、本モデルはAUC0.96、正答率0.875、感度0.885、特異度0.861、陽性的中率0.893、陰性的中率0.851と、優れたパフォーマンスを示した。さらに、Grad-CAM分析により、椎間板の膨隆や脊髄のT2信号強度の増強など、DCMが示唆される所見が特定され、本モデルの高い病変検出能力が示された。研究チームは「本研究におけるサンプルは三次医療機関から収集されている。選択バイアスによる偽陽性を避けるため、今後は大規模多施設でのモデルトレーニングが必要である」と述べている。参照論文：Deep learning-based prediction of cervical canal stenosis from mid-sagittal T2-weighted MRI関連記事：1. 頚椎骨折検出AI「CINA-CSpine」- FDA認証を取得2. 米MIT 小児の頚椎損傷をAIで予測3. AIを用いた転移性脊椎腫瘍と脊椎圧迫骨折のMRIによる鑑別

糖尿病網膜症の検出AI―臨床現場における成果―

R.A. - 2025年4月3日

先日の記事にもあるように、糖尿病患者に対する網膜症検出AIの臨床応用は数多く進む一方、その成果に関する報告は多くない。インドのチームによる本研究では、糖尿病網膜症検出AIが高い精度を示し、臨床現場において有効性を示すことが報告された。同研究はJAMA Network Openに掲載されている。背景として、本研究チームはGoogle LLCおよびVerify Life Sciences LLCと連携し、糖尿病網膜症（DR）のスクリーニング用深層学習システム「ARDA」を2018年より導入しており、すでに60万人以上のスクリーニング検査を行っている。本研究では、スクリーニング患者の約1％（4,537患者）を対象とし、眼科医3名によるDRおよび糖尿病黄斑浮腫（DME）のグレードについての判定とARDAの出力とを比較した。重症非増殖性糖尿病網膜症および増殖性糖尿病網膜症に対するARDAの精度は、感度が97.0％、特異度が96.4％と高い性能を示した。また、失明の恐れがある糖尿病網膜症に対する精度も、感度が95.9％、特異度が94.9％と優れたもので、臨床的に重要な見逃し率は3.7％であった。著者らは「本研究は、眼科領域におけるAIアルゴリズムの大規模な臨床性能報告として、初めてのものである。AI機器の導入過程では様々なコストがかかるが、各AI医療機器会社がそれぞれの臨床応用データを公開することで、より一層の患者安全に繋がるだろう」と述べている。参照論文：Performance of a Deep Learning Diabetic Retinopathy Algorithm in India 関連記事：1. AIは糖尿病性眼疾患の進行を予測できるか？2. 糖尿病に伴う全身性血管障害を網膜画像から予測するAI：システマティックレビュー3. 網膜眼底画像によるパーキンソン病スクリーニング

AI心電図により先天性心疾患における左室収縮不全を予測

Kazuyo NAGASHIMA - 2025年4月2日

先天性心疾患（CHD）を有する小児の生存率は著しく向上し、現在では90％以上が成人に達し、米国や欧州には100万人以上の成人CHD患者が存在するとされる。その中で、左室収縮不全（LVSD）は、CHD患者において心血管イベントの独立した危険因子である。成人一般集団においては、AI心電図（AI-ECG）分析によるLVSDの予測が広く行われているが、CHD患者を対象とした分析は未だ十分に行われていない。米ハーバード大学ボストン小児病院の研究チームは、CHDを有する患者の心電図と心エコーを用いて、LVSDを検出・予測するAIモデルを構築した。この研究成果は、The Lancet Digital Healthに発表された。研究チームは、先天性心疾患患者の心電図と心エコーのペア124,265件を用いて畳み込みニューラルネットワーク（CNN）を訓練し、40％以下の左室駆出率を検出するモデルを構築した。本モデルは、内部テストにおいてAUCが0.95、外部テストにおいてAUCが0.96という優れた精度を示した。また、AI-ECGにおける高リスク群では、年齢で調整したハザード比が12.1と、将来のLVSD発症リスクが有意に高いことが確認された。また、高リスク群では、低リスク群に比較して、全死因死亡率も高かった。著者らは「将来的に、本AI-ECGによりCHD患者のLVSDを低コストでスクリーニングできる可能性があり、臨床現場での意思決定に重要な影響を与えるかもしれない」と述べている。参照論文：Electrocardiogram-based deep learning to predict left ventricular systolic dysfunction in paediatric and adult congenital heart disease in the USA: a multicentre...

生成AIと医師の診断精度を比較：システマティックレビュー&メタアナリシス

Y Global - 2025年4月1日

昨今、生成AIが「医療診断の意思決定支援」に実質的な貢献を果たし得るかについて、多くの議論が重ねられてきた。こうした中、大阪公立大学を筆頭とした研究チームが、大規模言語モデル（LLM）の医療診断精度を評価した83件の研究を対象に、システマティックレビューとメタアナリシスを実施した。 Natureの関連誌であるnjp Digital Medicineから公開された研究論文によると、研究チームはMEDLINEやScopusを含む複数の文献データベースから18,000件超の論文を検索し、最終的に83件の「診断タスクに対する生成AIの検証研究」を対象に統計解析を実施した。解析の結果、生成AI全体の診断精度は52.1%、非専門医との差はわずか0.6%であり、統計的有意差は認められなかった（p=0.93）。一方、専門医と比較した場合は、AIの診断精度が15.8%劣ることが明らかとなった（p=0.007）。多くの研究が高いバイアスリスク（小規模な検証データセットや、学習データの不透明さなど）を含んでいたが、低リスク研究に限定しても全体傾向に大きな変化はなかったとしている。本研究は、生成AIが現時点で専門医の代替にはなり得ないものの、非専門的な診断支援や医学生・研修医への教育補助ツールとしての有用性を持つことを示唆している。また、特定のモデル（GPT-4oやClaude3など）は非専門医と同等、またはそれ以上の性能を発揮しており、今後のモデル開発の方向性として、医療分野に特化した調整と外部検証の強化が重要であるとしている。参照論文： A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians 関連記事： Siemens Healthineers – 生成AIを画像レポートに適用生成AIがヘルスケアをより安価にする？生成AIによる偽医療情報の作成検証

ICU患者の褥瘡を予測するAI

Kazuyo NAGASHIMA - 2025年3月31日

ICU患者は、長期臥床、循環不全、低栄養などの複数の要因により、褥瘡の発生リスクが高い。褥瘡リスクの予測には、ブレーデンスケールなどのいくつかのアセスメントツールが使用されているが、人工呼吸器管理中の患者は鎮静下にあるため、知覚や活動性の評価が困難である。中国の研究チームは、XGBoostを用いて「人工呼吸器を使用しているICU患者に対する褥瘡発生予測モデル」を構築した。 Natureの関連誌であるScientific Reportsに掲載された論文によると、米国ベス・イスラエル・ディーコネス医療センターのICUに入院した76,000人以上のデータベース（MIMIC-IV）から、呼吸器管理がなされた29,448名の患者が選択され、トレーニングセット（20,614名）と検証セット（8,834名）にランダムに分類された。このうち2,052名の患者で褥瘡が発症したが、XGBoostを用いた予測モデルにより、トレーニングセットでAUC0.797、検証セットで0.739を達成した。さらに、SHapley Additive exPlanations分析により、敗血症、年齢、血小板数、ICU滞在期間、PaO2/FiO2など、褥瘡発生の原因となる重要な10種類の特徴量を同定した。研究チームは「本モデルの臨床応用に向けては、患者の移動性や予防的介入措置など、患者の転帰に大きく影響を与える要素をモデルに組み込むこと、また異なる医療機関や患者集団で外部検証を行うことが重要である」と述べている。参照論文：Explainable SHAP-XGBoost models for pressure injuries among patients requiring with mechanical ventilation in intensive care unit 関連記事： AIによる褥瘡予測「3D印刷された皮膚」が創傷治癒を加速する日常診療データを用いた褥瘡予測AI

COPD患者におけるICUせん妄を予測するAI

Kazuyo NAGASHIMA - 2025年3月27日

せん妄は、死亡率の上昇に寄与する独立した危険因子であり、患者の予後を悪化させることが知られている。過去の研究から、ICUに入院したCOPD患者において、せん妄の有病率が高いことが明らかになっており、特に注意が必要である。中国の研究チームは、ICU管理を必要とするCOPD患者のせん妄リスクを予測する機械学習モデルを開発し、その成果をPLOS Oneに発表した。研究チームは、米ベス・イスラエル・ディーコネス医療センターに入院した19万人以上の患者データベース（MIMIC-IV）から、呼吸不全を伴うCOPDでICUに入院した65歳以上の患者1,155名を選択し、せん妄グループと非せん妄グループに分類して解析を行った。k近傍法、ランダムフォレスト、ロジスティック回帰、XGBoostの4つの機械学習モデルが訓練され、せん妄リスクを予測した。モデルの有効性は、検証セットにおいて正答率、F1スコア、適合率、再現率により評価された。その結果、XGBoostモデルが0.932という最高のAUCを示し、他にも正答率0.891、F1スコア0.810、適合率0.839、再現率0.795と優れたパフォーマンスを示した。さらに、せん妄の主要な危険因子として、SHapley Additive exPlanations分析により、Glasgow Coma Scaleスコア（言語機能）、入院期間、入院初日の平均SpO2などが特定された。著者らは「本予測モデルの実用化に向けて、今後多様な集団において外部検証を行い、モデルの適応性を高める必要がある」と述べた。参照論文：Enhanced machine learning predictive modeling for delirium in elderly ICU patients with COPD and respiratory failure: A retrospective study...

転移性脳腫瘍の原発巣同定を行う機械学習モデル

Kazuyo NAGASHIMA - 2025年3月26日

転移性脳腫瘍は、頭蓋内病変の約10〜15％を占めるとされる。一般的に、原発巣の同定にはMRIが使用されるが、原発巣が不明な場合には侵襲的な生検が必要となることもある。中国の研究チームは、造影T1強調画像を用いて、転移性脳腫瘍において頻度の高い肺がんと乳がんを区別するラジオミクスモデルを開発し、その成果をTranslational Cancer Researchに発表した。 2015年から2023年までに、病理検査および画像検査によって診断された肺がんを原発巣とする転移性脳腫瘍患者118名と、乳がんを原発巣とする転移性脳腫瘍患者62名の造影T1強調画像をレトロスペクティブに解析した。データはトレーニングセット（126件）と検証セット（54件）にランダムに割り当てている。13種類の重要な画像的特徴量を同定し、これに基づいてロジスティック回帰、サポートベクターマシン、k近傍法、多層パーセプトロン、勾配ブースティング（LightGBM）などの多様な機械学習モデルを構築した。その結果、LightGBMにおいてトレーニングセットで0.875、検証セットで0.866という最も高いAUCを達成している。本研究では、MRIラジオミクスモデル、特にLightGBMが転移性腫瘍における原発巣の区別に重要な役割を果たす可能性が示されている。研究チームは「今後さらなるデータの集積によりパフォーマンスを改善することで、本モデルが原発巣不明の転移性脳腫瘍の同定、診断、予後評価において重要な役割を果たすことが期待される」と述べた。参照論文：Radiomics models using machine learning algorithms to differentiate the primary focus of brain metastasis 関連記事：1. 機械学習による脳腫瘍の悪精度判定2. MRI画像から脳腫瘍の硬さを自動検出3. 脳腫瘍の悪性度をMRI検査画像からAIで予測 – 京大 iCeMs

軟部肉腫におけるMRIを用いたAIの診断的有用性：ミニレビュー

Kazuyo NAGASHIMA - 2025年3月25日

軟部肉腫（筋肉や脂肪などの軟部組織に発生する悪性腫瘍）は、MRIにおいていくつかの特徴を示すが、これまでMRI画像のみから異形度や分化度を判別することは困難であった。ドイツの研究チームは、軟部肉腫におけるMRIを用いた畳み込みニューラルネットワーク（CNN）の診断的有用性についてのミニレビューを行い、その結果をFrontiers in Oncologyに発表した。研究チームは、軟部肉腫におけるMRIを用いたCNNの診断的有用性に関する研究について、PubMed、MEDLINE、Google Scholarを検索し、基準を満たす12件の研究をレビューした。これらの研究のうち、7件は異形度と分化度の評価に関するもので、感度は0.85から0.98、特異度は0.33から1、AUCは0.74から0.96の範囲であった。また、3件は治療反応に関する研究であり、2件は転移と再発予測に関する研究であった。転移に関しては、肺転移の予測に関する研究であり、感度は0.47、特異度は0.97、AUCは0.83だった。使用されたAIモデルは、ResNet、ランダムフォレスト、サポートベクターマシンなど多岐に渡る。本レビューでは、CNNを用いたMRIによる軟部肉腫の診断に関する多くの研究が、異形度および分化度の評価に焦点を当てていることが示された。特異度にはばらつきが見られるものの、診断性能は比較的良好であることが確認されている。研究チームは「将来的には本モデルにより、軟部肉腫の診断および評価のために穿刺が不要となる可能性がある」と述べた。参照論文： Diagnostic utility of MRI-based convolutional neural networks in soft tissue sarcomas: a mini-review 関連記事： MRI画像から腎容積を自動計算するCNNモデルユーイング肉腫患者の5年生存率を予測するAIツール後腹膜肉腫の悪性度をCT画像から予測

機械学習×MRI：パーキンソニズムの自動鑑別の実現へ

R.A. - 2025年3月24日

パーキンソニズムを呈するパーキンソン病（PD）、パーキンソニズム型多系統萎縮症（MSA-P）、進行性核上性麻痺（PSP）の臨床的な鑑別は困難な場合が多く、客観的で高精度な診断ツールの開発が望まれている。この課題に対し、米フロリダ大学らの共同研究チームは、MRIに機械学習をかけ合わせたAIDPという手法を開発し、その臨床的鑑別性能を評価する前向き研究の成果を発表した。3月17日よりJAMA Neurologyに掲載されている。同研究では、PD、MSA、PSPと臨床的に診断がついた40歳から80歳の患者を対象とし、前向きコホート249名（PD：99名、MSA：53名、PSP：97名）と、後向きコホート396名（PD：211名、MSA：98名、PSP：87名）のデータを用いた。3テスラMRI拡散強調像から得た2つのパラメータと、患者の年齢・性別を併せて入力ベクトルとし、サポートベクターマシン（SVM）の学習を行ったものをAIDPと名付けている。前向きコホートのテストセットでAIDPの診断識別タスクを行ったところ、いずれも高精度を示し、各タスクにおけるAUC、陽性的中率（PPV）、陰性的中率（NPV）は以下の通りであった。・PD vs 非定型パーキンソニズム：AUC 0.96、PPV 0.91、NPV 0.83・MSA vs PSP：AUC 0.98、PPV 0.98、NPV 0.81・PD vs MSA：AUC 0.98、PPV 0.97、NPV 0.97・PD vs PSP：AUC 0.98、PPV 0.92、NPV 0.98また、AIDPによる予測は、神経病理学的にも93.9％の精度があると検証されている。研究チームは「本研究の精度はいずれも十分なものであった。今後は、AIDPを神経変性疾患のバイオマーカーと組み合わせて用いることで、疾患の定義や鑑別の精度向上に繋げたい」と述べている。参照論文：Automated Imaging Differentiation...

AI心電図―性別特異的な心血管リスクを可視化

R.A. - 2025年3月19日

近年のAI研究の進化により、心電図や心エコーにAI技術を組み合わせることで、多くの有用な知見が得られることがわかってきている。このほど英インペリアルカレッジロンドンは、AIを用いた新しいスコアで、心電図から性別特異的な心血管リスクを評価する研究をThe Lancet Digital Healthに発表した。従来の心血管リスク評価においては、性別を層別因子とする際に「男性・女性」の二値変数として扱い、一般に女性の方が男性よりもリスクが低いとされてきた。一方で本研究チームは、より個別化した評価が必要であると考え、AIを用いて心電図から予測されるスコアを元に心血管リスクを評価することを目的とした。本研究では，米ベスイスラエルディーコネス医療センター（BIDMC）の110万件、英バイオバンク（UK）の４万件の心電図データで畳み込みニューラルネットワーク（CNN）を訓練し、心電図から連続変数として性別を予測するAIモデルを開発した。性別の二値分類タスクに対しては、本モデルはAUROCが0.943（BIDMC）、0.971（UK）と高い精度を示した。その下で、患者の実際の性別とAIの予測値との差分をスコアとし、心血管リスクとの関係をCox回帰モデルで評価したところ、女性においてハザード比が1.78（BIDMC）、1.33（UK）となり、この差分が大きいほど心血管リスクが高まることが明らかとなった。一方、男性においてはハザード比の有意な上昇は見られず、女性のみにおいて、リスク層別化に役立つ可能性が示された。著者らは「一般に低リスクとされる集団でも、AIを用いたスコアの再計算で心血管リスクを再評価することが可能となった。スコアに影響する遺伝的要因や背景の病態についても今後研究が必要である」と述べている。参照論文：Artificial intelligence-enhanced electrocardiography for the identification of a sex-related cardiovascular risk continuum:a retrospective cohort study 関連記事：1. AI心電図 – リスク患者の特定により院内死亡を大幅に低減2. 心電図AIで心臓発作のスクリーニング能力を向上3. 心電図から死亡リスクを高精度予測

糖尿病に伴う全身性血管障害を網膜画像から予測するAI：システマティックレビュー

Kazuyo NAGASHIMA - 2025年3月18日

網膜血管は肉眼で直接観察できる唯一の血管であり、「全身血管の窓」とも称される。網膜画像を用いて網膜症を検出するAIモデルはすでに広く臨床応用されているが、シンガポールの研究チームは網膜画像から全身性血管系障害を予測する可能性に注目した。網膜画像のAI分析を通じた「糖尿病に伴う全身性血管系障害の予測および検出」に関するシステマティックレビューを行い、その結果をeClinicalMedicineに発表した。研究チームは、2000年から2024年の期間において、糖尿病による血管系障害の検出のためにAIを用いた網膜画像分析に関する文献について、PubMed、Web of Science、Google Scholarを検索し、38件の研究レビューを行った。テーマとしては、糖尿病予備群または健常者における糖尿病発症予測（n＝4）、糖尿病患者の合併症発症予測（n＝10）、眼底検査やOCT（光干渉断層計）を利用した網膜微小血管障害の検出（n＝8）、心血管系障害のリスク予測（n＝10）などが含まれた。網膜画像撮影のモダリティは、大半が眼底写真であり、6件ではOCTが使用されていた。AIモデルには、畳み込みニューラルネットワーク、ResNet、RETFoundなど、さまざまなモデルが採用された。AUCは0.676から0.971の範囲で、特に慢性腎疾患検出（AUC：0.911）、心血管疾患予測（AUC：0.971）、糖尿病末梢神経障害（AUC：0.867）などの分野で優れた結果が報告されていた。また、AIモデルの予測精度は、年齢、性別、血圧、HbA1cなどの複数要因を考慮することで大幅に改善されることが明らかとなっている。今回のレビューでは、糖尿病性網膜症におけるAIスクリーニングが全身性血管障害の予測および検出において有望であることが示されている。研究者らは「特に低中所得国の眼科医療へのアクセスが限られる農村地域において、これは画期的なツールとなるだろう」と述べた。参照論文： Use of artificial intelligence with retinal imaging in screening for diabetes-associated complications: systematic review 関連論文：糖尿病網膜症スクリーニングAIをカナダ農村部に Eyenuk – 米国での大規模な糖尿病性網膜症スクリーニングサービス実施へ AIは糖尿病性眼疾患の進行を予測できるか？

AIによる大動脈弁石灰化の自動定量

Y Global - 2025年3月14日

大動脈弁石灰化の定量は、大動脈弁狭窄症（AS）の重症度評価や心血管リスク予測、治療方針の決定に不可欠である。従来、Agatstonスコアを用いたマニュアル評価が標準とされてきたが、非造影CTを必要とし、放射線被曝の増加や作業の煩雑さが課題だった。韓国・ソウル大学の研究チームはこのほど、深層学習モデルと機械学習モデルを組み合わせ、造影冠動脈CT（CCTA）を用いた大動脈石灰化の自動定量化手法を開発し、その成果をScietific Reportsに発表した。本研究では、177名の患者データを用いて、CCTA画像から大動脈弁領域を自動抽出し、最適化したHU（Hounsfield Unit）閾値を適用することで精度の高い石灰化の自動定量を実現した。具体的には、まず深層学習モデル（DeepLab v3+）により大動脈弁をセグメンテーションし、機械学習モデル（XGBoost）を用いて代表的なCT値を算出した。その後、この代表CT値の1.45倍を超える領域を石灰化と判定することで、従来のAgatstonスコアに類似した加重スコアを算出した。結果として、重度ASの分類では感度88.6%、特異度91.1%、陽性的中率（PPV）88.6%、陰性的中率（NPV）91.1%を達成した。これは、従来のマニュアル評価と比較して、作業の標準化や作業者への依存の低減が期待される結果となった。ただし、低密度の石灰化や血流の高CT値領域の誤検出など、一部のケースで誤判定も見られた。研究者らは「本技術は、非造影CTを使用せずに大動脈弁石灰化を正確に測定できる新たな選択肢を提供し、臨床現場での診断プロセスを効率化できる可能性がある」と述べている。参照論文： Deep learning based automatic quantification of aortic valve calcification on contrast enhanced coronary CT angiography 関連記事：骨密度検査から腹部大動脈石灰化を評価するAI 大動脈弁狭窄症リスクを特定するAIビデオバイオマーカー心臓弁膜症の検出を自動化

胎児顔面奇形の検出を行うAI：システマティックレビュー

Kazuyo NAGASHIMA - 2025年3月12日

口唇口蓋裂や小顎症をはじめとする「胎児の顔面奇形」を早期に検出することは、基礎疾患の特定や染色体検査などの迅速な医療介入につながる。現在、胎児異常の検出には超音波検査が広く用いられているが、解像度や検査技師の技術に起因する誤診が発生することがあり、この課題を克服するためにAI技術が貢献する可能性がある。インドの研究チームは、AIを用いた胎児顔面奇形の検出に関する既存文献についてシステマティックレビューを行い、その結果をArtificial Intelligence Reviewに発表した。過去15年間の文献を対象に、PubMed、IEEE、Xploreなどのデータベースから、胎児顔面奇形のAI診断に関する文献が検索された。顔面奇形の画像解析において最も広く使用されているモデルは、畳み込みニューラルネットワーク（CNN）であり、詳細な顔面構造や欠損を特定し、正確な診断に寄与した。また、U-Netはセグメンテーション技術として優れており、顔面奇形の局在化や形状の識別に効果的だった。さらに、敵対的生成ネットワーク（GANs）を用いることで、合成画像を生成し、データ不足の問題を補完するアプローチも試みられた。加えて、リカレントニューラルネットワーク（RNN）を活用した研究では、胎児の顔面構造の経時的変化を追跡し、奇形の進行を解析する可能性が示唆されている。研究チームは「臨床現場における顔面奇形のAI診断を可能とすることで、家族に対し早期に精神的サポートや関連知識の提供、さらには適切な出生前治療や出産計画の策定が可能になる」と述べている。今後は、AIによる画像診断に加え、超音波検査、遺伝子検査、病歴など複数の要素を統合することで、さらに優れた精度の診断が期待される。参照論文：A comprehensive review of artificial intelligence-based algorithm towards fetal facial anomalies detection (2013–2024) 関連記事：1. 胎児の超音波スクリーニングを支援するAIモデル研究2. AIによるモニタリングで妊婦と胎児の死亡率低下を実現3. 子どもの顔写真から遺伝性疾患をスクリーニングするAI研究

小児レントゲン画像における消化管拡張を診断するCNNモデル

Kazuyo NAGASHIMA - 2025年3月7日

腹部X線画像における消化管拡張は、嘔吐や腹痛などを訴え受診する小児に頻繁に認められる所見である。正確な診断と手術適応のある患者の特定を迅速に行うことは、速やかな外科的介入のために重要である。トルコの研究チームは、畳み込みニューラルネットワーク（CNN）モデルを利用して、異常な消化管拡張のX線画像の特定を行い、Diagnostic and Interventional Radiologyに研究成果を公表した。研究者らは、2019年から2022年までに撮像された消化管拡張または閉塞所見のあるX線画像612枚を、手術を要した患者群（298枚）と手術を要さなかった患者群（314枚）に分類し、さらに消化管異常以外の目的で撮像された腹部X線画像をコントロール群（540枚）として3グループに分類した。そして、事前に訓練された5種類のCNNモデル（ResNet50、InceptionResNetV2、Xception、EfficientNetV2L、ConvNeXtXLarge）について、転移学習と検証を行った。正常画像と異常画像の区別では、正解率がResNet50で93.3%、InceptionResNetV2では90.6%となり、手術を要した群と要さなかった群の区別では、EfficientNetV2Lで94.6%で最も高い精度を示した。研究チームは「CNNモデルの転移学習を使用し、小児の消化管閉塞を高い精度で診断できることが示された」と結論付けている。今回、手術を要した群に16疾患が含まれたが、サンプル数が少なく個別評価が困難であったため、今後の多施設研究も期待される。参照論文： Diagnostic accuracy of convolutional neural network algorithms to distinguish gastrointestinal obstruction on conventional radiographs in a pediatric population 関連記事：癒着性小腸閉塞の手術適応を識別するAI 「小児救急外来でのAI活用」を保護者は受け入れるか？小児救急を迅速化する機械学習ベースの自律検査指示

浸潤性乳管がんの遠隔転移リスクを予測するAI

Kazuyo NAGASHIMA - 2025年3月6日

浸潤性乳管がん（IDC）は、血行性・リンパ行性に他臓器転移を来しやすいことで知られるが、適切な予後予測と乳がん全体の死亡率低下のためには、転移リスク評価が重要である。中国の研究チームはこのほど、機械学習によるIDCの遠隔転移リスク予測に関するAIモデルを開発し、PLOS Oneに発表した。研究者らは、米国SEERデータベースを用いて88,236名のIDC患者の臨床・病理学的データを収集し、特徴量選択とデータ前処理を行った。そして、ランダムフォレスト、XGBoost、ロジスティック回帰、サポートベクターマシンの4つのアルゴリズムに基づき遠隔転移リスク予測モデルを構築し、さらに投票メカニズムによるハイブリットモデルを開発した。モデルは、正解率、適合率、再現率、F1スコア、AUCで比較され、その結果、投票メカニズムに基づくハイブリッドモデルが最も高い値を示した（正解率：0.867、適合率：0.929、再現率：0.805、F1スコア：0.856、AUC：0.94）。また、優れた予測因子として、手術の有無、TNステージ、腫瘍サイズ、化学療法の過去歴が特定された。現在のところ、AIによるIDCの遠隔転移リスク予測に焦点をあてた研究はほとんど行われていない。研究チームは「医師らは、本モデルに必要な臨床的・病理学的検査情報を簡単に入力することで、転移リスクを迅速に得ることができる」と述べている。参照論文：Machine learning-based prediction of distant metastasis risk in invasive ductal carcinoma of the breast関連記事：1. 「AIアルゴリズムの組み合わせ」が乳がんリスクの長期予測に寄与2. 乳がん手術における腫瘍摘出精度を向上させるAI3. 乳がん病理画像から「HER2発現の有無」を予測するAI

AIによる「てんかん治療薬の仮想ランダム化比較試験」 – 米ハーバード大学

R.A. - 2025年3月5日

近年、医療分野における人工知能、特に大規模言語モデル（LLM）の活用が注目されている。このたび米ハーバード大学の研究チームは、LLMを用いて、てんかん治療薬の有効性を評価するシミュレーションによるランダム化比較試験（RCT）を実施し、その成果をEpilepsy Researchに発表した。本研究では、AIが大量の臨床データから情報を抽出し、治療効果を推論する能力の評価を目的とした。仮想RCTの概要は、てんかん治療薬を模した薬剤の効果を検証するために、240人の患者をプラセボ群と薬剤群に無作為に割り付け、患者の発作頻度を発作日記シミュレーター「CHOCOLATES」で再現したものである。CHOCOLATESは、実際に行われた過去のRCTとの照合から、てんかん患者の発作挙動をよく再現することが検証されており、本実験では多様な発作パターンを示すよう設定された。その後、3つの異なるLLMを用いて、①発作日記を基にした自由記述での記録（カルテ記述）、②記録から発作回数や症状などの情報抽出および要約、③要約を統合したデータ解析の3工程を行い、医師が①の記録を元に解析したデータとの比較を行った。その結果、薬剤の有効性を評価する指標である50％反応率と中央値変化率の両者において、AIと人間の計算値の差が1%程度とほとんど違いが無く、人間の分析と同程度にAIが薬剤の有効性を評価できることが示された。著者らは「本研究は概念実証（proof-of-concept）として行ったものだが、非構造化臨床データからAIが帰納的推論を行うことが可能だと示した。また自由記述での記録には、実際の臨床現場と同様に不正確な報告や記述などの『ノイズ』を交えたが、本システムでは効果や副作用を適切に判別することができ、応用可能性が高いことが示唆される」と述べている。なお、本研究のソースコードはGithubにて公開されている。参照論文：Inductive reasoning with large language models: A simulated randomized controlled trial for epilepsy 関連記事：1.大規模言語モデルがEBMを推進する2.TRIPOD+AI – ヘルスケア研究におけるAI利用を反映する新ガイドライン3.UCLA「MOVER」 – AI研究推進のための大規模手術室データベースを公開

菌血症診断はAIの時代へ？早期介入を可能に

R.A. - 2025年3月4日

菌血症には迅速な診断と治療が求められるが、血液培養検査の結果には1-2日を要し、また皮膚常在菌の混入による偽陽性もありうるため、より早期に確定診断を得るための手法が模索されている。これに対し、英インペリアルカレッジロンドンの研究チームは、深層学習を用いて、入院患者の日々の血液データから菌血症状態を高精度に予測可能だと発表した。 The Lancet Digital Healthに掲載された本研究では、菌血症疑いで血液培養検査を受けた20,850人のデータを用いた。患者の年齢、性別、血液バイオマーカーのデータを、血液培養検体採取前の最大14日間までレトロスペクティブに収集し、モデルの学習を行った。LSTMモデル（時系列モデル）および静的ロジスティック回帰モデルに学習を行い、血液培養が陽性となるか否かを予測させたところ、総じてLSTMモデルの精度が良く、テストデータでAUROCが0.97、AUPRCが0.65という結果を得た。また時系列情報を除くとモデル性能は低下し、特にCRP・好酸球数・血小板数の変動が重要な指標であることが明らかとなった。研究チームは「本研究のようなモデルを用いて菌血症リスクの層別化を行うことで、血液培養をより適切に確信を持って実施できるようになり、抗菌薬の不適切使用の抑制にも繋がるだろう」と述べている。今後は、菌血症予測モデルの臨床的有用性、費用対効果などを前向き研究で検証することが期待される。入院患者の日常的な臨床データの活用法についても、より一層の発展が望まれる。参照論文：Utilising routinely collected clinical data through time series deep learning to improve identification of bacterial bloodstream infections: a retrospective cohort study関連記事：1.「敗血症治療開始の最適なタイミング」を予測するAI2....

【ダイジェスト】The Medical AI Times Podcast #1 | 前立腺がん検出AIから読み解く、AI社会実装への道

The Medical AI Times - 2025年3月3日

この記事は、The Medical AI Times Podcast第1回をもとに編集・構成したものです。ポッドキャスト音源とあわせて、テキストでも情報をキャッチアップできるようにお届けします。【番組概要】■タイトル：前立腺がん検出AIから読み解く、AI社会実装への道＃1■配信日時：2024/10/1■出演者：島原佑基、植田大樹、中安杏奈、宮内諭■第一回テーマ：前立腺がん検出AIから読み解く、AI社会実装への道 #1■配信ページ：Spotify：https://podcasters.spotify.com/pod/show/the-medical-ai-times/episodes/AIAI-1-e2p2dvhApple Podcast：https://bit.ly/3BBQ23eAmazon Music：https://music.amazon.co.jp/podcasts/c1e89571-4fe4-4b6e-85c0-de143c573d8c/the-medical-ai-times-podcast-Voicy：https://voicy.jp/channel/784845YouTube：https://youtu.be/TdQWqZ2mIPI 参照論文： Fully Automated Deep Learning Model to Detect Clinically Significant Prostate Cancer at...

より安全で効果的な造影検査の実現へ-AIによる造影効果の増幅

R.A. - 2025年2月28日

造影剤は病変の発見を容易にする一方で、副作用などの懸念から、なるべく患者負担の少ない用量での使用が望まれている。特に脳の潜在性転移の検出では、高用量造影MRIが有用であることが知られているが、先日2月19日、ディープラーニングを用いて通常の造影MRI T1強調画像（T-SD画像）から「2倍量造影画像（A-DD画像）」を生成することで、読影精度が向上したという研究成果がInvestigative Radiologyに発表された。独ボン大学や米ハーバード大学などの共同研究チームが行った本研究では、脳転移を有する患者の非造影画像/低用量造影画像/T-SD画像を用いて、画像処理に適したディープラーニングモデル（U-Netモデル）を学習し、30人の患者のT-SD画像から造影効果を抽出して2倍に増幅した画像：A-DD画像を生成した。4名の医師（放射線科医2名、フェロー、研修医）が両画像を用いて読影を行った結果、A-DD画像を併用する方が、より多くの転移を検出可能という結果が得られた。放射線科医では感度が12.1%上昇し、経験の浅いフェローや研修医では、7-12％程度多くの転移を発見できた。また、フェローや研修医の読影の感度は、T-SD画像のみを用いた放射線科医の読影と同程度まで向上していた。とりわけ5mm以下の転移に対する感度の上昇が顕著であった。著者らは「AIの補助により、読影精度を高めることに加え、造影剤の使用量の削減に繋げられる可能性がある」と述べている。今後は他の画像診断モダリティへの応用や検証が望まれるだろう。参照論文：Deep Learning–Based Signal Amplification of T1-Weighted Single-Dose Images Improves Metastasis Detection in Brain MRI 関連記事：1. CTスキャンから「MRI品質の脳画像」を提供2. 不要な生検を防ぐ – MRIに基づく乳がんリスク予測モデル3. AI技術でMRI検査のガドリニウム造影剤を10分の1に – Subtle Medical

1...345 ページ％CURRENT_PAGE％の％TOTAL_PAGES％

年間アーカイブ 2025

最新の記事

注目の記事

注目の記事

最新の記事