医療とAIのニュース 2023
年間アーカイブ 2023
ディープラーニングモデルが心房細動を正確に予測
JAMA Cardiologyに発表された研究では、ディープラーニングモデルが「症状の無い患者における心房細動の兆候」を正確に検出できることを実証している。
心房細動は、脳卒中やその他の心血管合併症に関連するため、有害な転帰を防ぐためには早期発見が重要となる。心房細動は最も一般的な心臓リズム障害の1つであるが、心房細動を持つ人の3人に1人は、自身が心房細動であることに気づいていないとされる。米Cedars-Sinaiの研究チームは、1987年から2022年までに、退役軍人省の2つの医療ネットワークにおいて患者から収集された心電図データを用い、このディープラーニングモデルを訓練した。
モデルに、洞調律心電図(正常波形)から1か月以内の心房細動を予測させたところ、Cedars-Sinaiの症例データセットでは、AUC 0.93、精度0.87、F1スコア0.46を示した。結果を受け、著者らは「このツールは多様な患者群に渡って心房細動を同定し、有害事象を予防するのに役立つ」と結論付けており、ツールとしての応用が、米国の一般集団に利益をもたらす可能性があることを指摘する。
参照論文:
Deep Learning of Electrocardiograms in Sinus Rhythm From US Veterans to Predict Atrial Fibrillation
関連記事:
カルディオインテリジェンス – 発作性心房細動の兆候を検出するAI技術
機械学習による「心房細動後の早期死亡予測」
eBRAVE-AF trial – 高齢者における心房細動デジタルスクリーニング
超音波による微小血管描出技術でがん診断の精度を向上
腫瘍は血管組織に富み、その特性を利用した超音波検査による「悪性腫瘍の検出」が行われている。米メイヨークリニックの研究チームは、超音波検査画像の解像度を高めるソフトウェアを開発し、微小血管を高精細に描出することで、がんの診断精度を向上させる取り組みを続ける。
Cancersに発表された同研究によると、開発された高解像度超音波画像ソフトウェアは「quantitative high-definition microvessel imaging(q-HDMI)」と名付けられている。この技術は、人間の毛髪の約2倍に相当する太さ(約150μm)の微小血管を2D/3Dで明瞭に描出できる。さらにq-HDMIツールで取得された画像をもとに、腫瘍を良性か悪性か判別するAIを組み合わせることで、甲状腺結節の良悪性を84%の精度で識別できることが確認された。
従来、甲状腺結節の良悪性を超音波画像で診断する場合、その精度は35-75%程度と限られたものであった。そのため、多くの場合で生検が必要となり、患者にとって大きな負荷となっていた。著者のAzra Alizad医師は、「微小血管を可視化することで、がんの早期診断と治療が可能になる。生検せずに甲状腺結節の良悪性が判定できれば、患者を経済的・肉体的負担から救うことができる」と語っている。
参照論文:
Quantitative Biomarkers Derived from a Novel Contrast-Free Ultrasound High-Definition Microvessel Imaging for Distinguishing Thyroid Nodules
関連記事:
甲状腺生検を減らすためのAI活用
甲状腺がんスクリーニング精度を向上させるAIモデル研究
ATUSA – AI駆動による「ポータブル自動乳房3D超音波スキャナー」
ワシントン大学 – 「AI for Health Institute」を立ち上げ
McKelvey School of Engineeringは、米ワシントン大学の一部で、特に生物医工学や環境工学、コンピューティングの領域において全米屈指のプログラムを有する工学部だ。同大学はこのほど、新しい研究部門として「AI for Health Institute」の立ち上げを明らかにした。
公表によると、同Instituteは「競争の非常に激しいヘルスAI分野において、リーダーとして確立すること」を目指すという。64名の教授陣が加わるが、医学部からは37名、工学部からは23名、その他の学部からは4名が参加する。医学と工学のリソース融合によって、大規模な研究イニシアチブのための組織とインフラを構築する。
Chenyang Lu教授は「問題の複雑さとデータの乱雑さを考えると、基本的なAIツールではこれらの問題の多くを解決するには不十分だ」と述べ、加速度的に進むAI技術の進展に歩調を合わせ、ヘルス領域に最先端技術を積極的に取り入れていくことを狙う。
関連記事:
コロラド小児病院が小児精密医療研究所を立ち上げ
シダーズ・サイナイ – AI教育研究センターを立ち上げ
カイザー・パーマネンテ – 医療AI領域における新たな助成プログラムを開始
Klick Labs – スマホの10秒音声で糖尿病を識別
声の特徴から各種診断を行う手法が注目される。米スタートアップ「Klick Labs」は、わずか10秒スマートフォンに話しかけることで2型糖尿病を識別するAI技術を発表した。
Mayo Clinic Proceedings: Digital Healthに発表された同研究には、267名の被験者が参加し、2週間に渡って毎日6回、6-10秒のフレーズを録音し、その音声データを基に2型糖尿病患者を判定するAIモデルを構築した。結果としてこのモデルの識別精度は女性で89%、男性で86%に至っている。特筆すべき点として、男女間における糖尿病患者の音声特徴の違いが明らかにされた点を挙げ、研究チームは単純化した説明では、女性糖尿病患者は「ばらつきが少ないやや低いピッチ」、男性患者は「ばらつきが多いやや弱い声」とその特性を表現している。この違いについて、女性では「細胞外液バランスによる浮腫の影響」、男性では「筋力低下および筋萎縮」と関連する可能性が指摘されている。
国際糖尿病連盟「IDF」によると、「世界では糖尿病患者の約半数が、自分が糖尿病であることに気付いていない」という。本研究を主導するJaycee Kaufman氏は、「現在の糖尿病スクリーニングは多くの時間とコストを要するが、音声技術はそれら従来の障壁を取り除く可能性を秘めている」と語った。
参照論文:
Acoustic Analysis and Prediction of Type 2 Diabetes Mellitus Using Smartphone-Recorded Voice Segments
関連記事:
音声から疾患を捉える
声から冠動脈疾患リスクを評価するAI研究
Cardiokol – 電話音声で心房細動を検出するAI技術
「眼の老化」を測定
米Stanford Medicineの研究者らは、眼液研究のために開発した技術を用い、「眼の老化」を測定する新手法を提案している。
このほどCell誌から公開された研究論文によると、この新技術は、眼液中の約6,000個のタンパク質を調べ、そのうちの26個を使って老化を高精度に予測できるというもの。チームが有するTEMPO(tracing expression of multiple protein origins)技術では、RNA(タンパク質を作り出す)が存在する細胞の種類までタンパク質を追跡することで、疾患を引き起こすタンパク質の細胞起源を理解することを可能にする。TEMPOは眼球の老化計測だけでなく、肝胆汁や関節液など、他臓器液への応用も期待される。
研究者らが「まるで生きた細胞を手に取り、虫眼鏡で観察しているかのよう」と表現するこの技術は、分子レベルでの深い理解により、個々の眼球状態に基づいた治療薬選定など、精密医療の加速に資する可能性がある。
参照論文:
Liquid-biopsy proteomics combined with AI identifies cellular drivers of eye aging and disease in vivo
関連記事:
目の老化から腎不全リスクを予測
「犬の老化」を探る大規模データ収集プログラム
HistoAge...
CTスキャンから「MRI品質の脳画像」を提供
スウェーデン・ヨーテボリ大学の研究チームは、コンピュータ断層撮影(CT)で撮影された脳画像から磁気共鳴画像法(MRI)で撮影された画像と同程度の情報を得ることができる新技術を公開した。
現代においてCTは比較的安価かつ一般的な画像技術となりつつあり、世界のあらゆる地域で広く利用されている。しかしCTは、脳の微細な構造変化を再現することなどに関しては、MRIに劣ると考えられている。チームが開発したAIソフトウェアは、CTとMRIの両方の画像診断を受けた計1,117人の画像でトレーニングされた。これにより、比較的低画質のCTからも、MRIの高度な解析と同様の方法により、脳における種々の構造や領域を正確に測定することを可能にしたという。
研究チームは、特に正常圧水頭症について、このアプリーチが診断および治療効果モニタリングの両方に有効利用できるとする成果を得た。本ソフトウェアは現在、スウェーデン、英国、米国のクリニックと企業の協力により開発が続けられている。
関連記事:
CTレポートの偶発所見から肺がんリスク症例を抽出するAI
GEヘルスケア – AI搭載CTシステムを3000万ドルで受注
CTから冠動脈の血流低下を予測するAI
「喉頭摘出患者の代替音声」をクリアにするAI
喉頭がんにより喉頭摘出が必要となった患者は、発声に大きな変化が生じる。残された喉頭組織を利用して生み出す「代替音声」の質を向上させるため、リトアニア・カウナス工科大学の研究チームは、「代替音声の自動改善と評価を行うAI」を開発している。
Cancersに発表された同研究では、ディープラーニング技術を用い、代替音声のノイズをクリーニングするアルゴリズムを構築した。代替音声は発声法によって物理的ノイズや呼吸音が混在するため、聞き取りにくい場合も多い。本研究は、多目的最適化手法によってノイズを計算し、クリアな音声の再構成を可能にする。
現在、このアルゴリズムの臨床試験が、リトアニア健康科学大学病院の耳鼻咽喉科で進行中である。プロジェクトを率いるRytis Maskeliūnas教授は、「この技術によって、音声品質や計算効率などの要素を制御できる。その結果、代替音声からノイズを除去する効率が向上する」と述べている。
参照論文:
Pareto-Optimized Non-Negative Matrix Factorization Approach to the Cleaning of Alaryngeal Speech Signals
関連記事:
声を失った患者向けの読唇術AIアプリ「SRAVI」
「麻痺患者の表情豊かなコミュニケーション」を再現するBCI技術
SpeechVive – 耳掛け型ウェアラブルデバイスでパーキンソン病患者の発声訓練
All of Usに新センター
米国立衛生研究所(NIH)の「All of Us Research Program」は、コロラド大学アンシュッツメディカルキャンパスとそのパートナーに3000万ドル(44.8億円)を授与し、新たに「Center for Linkage and Acquisition of Data(CLAD)」を設立した。
All of Usプログラムは、米国の多様性を反映する少なくとも100万人の登録を目指した大型プロジェクト。多様なデータを収集し、その利用可能性を高めることで、新たな医学的発見に拍車をかけ、精密医療を促進することを目的とする。CLADでは、新しいタイプの情報を既存のAll of Us参加者データと結びつけることで、研究者が疾患の要因に関する洞察を得られるよう支援する。対象となる新たなデータストリームには、疾病予防管理センターからの環境情報や追加の保険請求データ、死亡データなどが含まれている。
All of Us Research ProgramのディレクターであるMartin Mendoza氏は「これらの追加データは、研究者が健康格差をさらに解明し、健康の公平性を高める上で重要な役割を果たすものだ」と述べている。
関連記事:
「All of Us」プログラムの利用可能データが拡大
少数派コミュニティのための責任あるAI実装
...
手術患者の表情から疼痛を評価するAI
疼痛の評価には現在、人種や文化のバイアスが介入しやすい「主観的な方法」が主流となっており、評価のばらつきとともに、頻回な評価による負担などが課題となっている。米カリフォルニア大学サンディエゴ校の研究チームは、手術患者の表情から痛みを自動評価するAI技術を開発している。
ANESTHESIOLOGY 2023年次総会で発表された同研究では、外科手術前後の患者69人を対象に、115件の疼痛時エピソードおよび159件の非疼痛時エピソードから143,293枚の顔画像を収集し、痛みを感じているかどうかを自動分類するAIモデルを構築した。AIモデルが顔面のどの部位に注目して疼痛パターンを識別しているか、ヒートマップを用いて解析したところ、特に「眉」「唇」「鼻」の表情と表情筋を重要な指標として捉えていることが分かった。同モデルは、従来の疼痛評価手法である「Critical-Care Pain Observation Tool(CPOT)」と88%、「Visual Analog Scale(VAS)」とは66%の一致をみた。
筆頭著者のTimothy Heintz氏は、「この技術を、患者ケアの質を向上させる新たなツールとできるかもしれない。例えば、手術後の回復室の壁や天井にカメラを設置し、1秒間に15枚の画像を撮影することで、患者に意識がなくても痛みを自動評価できる。これにより、痛みの評価に断続的に時間を割かれる看護師ら医療従事者は他のケアに専念できるだろう」と語った。
関連記事:
豪PainChek – 表情分析AIアプリで認知症高齢者の痛みを代弁
愛猫の痛みを教えてくれるAIアプリ「Tably」
AIが疼痛評価の社会的不平等を是正? – Nature Medicine 論文
AIでニューロフィードバックを高速化
AIを利用することで、脳活動の変化から「対応するニューロフィードバック信号を提示するまでの待ち時間」を50分の1に短縮することに成功した。研究結果は、Journal of Neural Engineeringからこのほど公開されている。
バイオフィードバックの一種であるニューロフィードバックは、50年以上の歴史がある。その核となるのは、脳波(EEG)を用いて記録された自身の脳活動情報を個人が受け取り、そのフィードバックに基づいて脳波を調整することを学習することにある。例えば、人は頭頂葉のアルファリズムに関するフィードバックを受けることで、リラックススキルを向上させることができる。ニューロフィードバックは、注意欠陥多動性障害(ADHD)やてんかん、うつ病などの治療から、ストレス耐性の強化、アスリートのトレーニングまで、幅広い応用が可能となる。
一方、ニューロフィードバックのトレーニングを受けた全ての人が大幅な改善を経験するわけではなく、約40%にはほぼ改善が見られないとの報告もある。その主な理由には、脳活動の変化と、その変化を反映したフィードバック信号の提示との間に生じる大幅な遅延にあると研究者らは指摘する。研究チームは、時間的畳み込みネットワーク(TCN)に基づき、リズム活動を分離するためのフィルターを構築した。アルファリズムの瞬間的強度を反映するフィードバック信号の提示遅延がわずか10ミリ秒に短縮され、これは従来の50倍の高速化に相当する。
著者らは、神経系機能障害に対するニューロフィードバック療法に反応する患者の割合を大幅に増やすことができると見込み、さらなる研究継続の意向を示している。
参照論文:
Real-time low latency estimation of brain rhythms with deep neural networks
関連記事:
AIによる脳波解釈
軽度認知障害をウェアラブル脳波計で検出
HoneyNaps「SOMNUM」 – 睡眠障害解析AIでFDA承認
Carta Healthcare – 「米国消費者のAIに対する信頼度と認識」調査
「米国一般消費者のAIに対する認識と信頼度」に関する最新の調査結果を、データ分析企業のCarta Healthcare社が発表した。
2023年8月に行われた本調査では、対象となった1,027人の米国消費者の、4人に3人が「医療分野のAIを信頼していない」としていた。さらに、患者の5人に4人が「医療提供者がAIをどう使用しているかを知らない」と回答。また、43%の回答者は自身のAIに関する理解度に限界を認めていた。一方で、米国消費者の中には「AIについてさらに学び理解を深めたい」という意欲も見受けられた。47%が「学ぶことでAIをより信頼できるようになる」と感じており、65%が「医療提供者からAI使用の説明を受ければ安心して利用できる」と回答していた。
Carta HealthcareのCEOであるMatt Hollingsworth氏は「この結果は、AIへの信頼性を向上させるため、ヘルスケア業界がその利点を消費者に啓蒙する必要性を示している。AIが人間の判断に取って代わるものではなく、補助的なツールとして役割を果たしていることを患者が理解できれば、医療分野におけるAI利用は最高の結果に至るだろう」と語った。
関連記事:
AI医療に対する患者の信頼度調査
消費者は「生成AIによるコンテンツ」を信頼する
医療AIへの信頼性を探る – GEヘルスケア「Reimagining Better Health」レポート
スマートメスがロボット機器による手術を実現する
センサーを内蔵したメスが、外科医のトレーニングを効率化し、「ロボット機器による手術」への道を開く可能性があることが示唆された。
英エディンバラ大学の研究では、センサーを搭載したスマートメスを利用することにより、外科手術中に医師が「どれだけの力をかけているか」、また、「どれだけの時間をかけてどのようにメスを操作しているか」を正確に追跡できることを明らかにした。チームが開発した小型の低コスト機器がメスの柄に取り付けられ、センサー付き回路基板に接続される。技術のコアは、メス使用者が力を加える際に取得したデータを分析する独自設計の機械学習モデルにある。このアプローチは、経験豊富な医師による目視評価を伴う従来の評価方法と同様、重要なスキルを効果的に評価できるとしている。
研究チームは「開発が進めば、力覚システムを搭載したこの技術を、幅広い手術スキルの評価に利用できるとともに、安全で効率的な手術が行えるロボット機器の開発に役立てることができる」ことを強調している。
関連記事:
認知症支援 – 失くしものを探すロボット「Fetch」
肺内を泳ぐマイクロロボットが肺炎を治療
四脚ロボット「Morti」は歩行を高速に学習する
HistoAge – 脳組織の年齢を識別するAI
「生物学的年齢」と「暦上の年齢」は、加齢の個人差によって乖離が生まれる。このような加齢メカニズムを脳の領域で解き明かすことは、認知症やアルツハイマー病への対抗策の鍵となり得る。米マウントサイナイ医科大学の研究チームは、脳の年齢を病理組織標本から予測する新しいAIモデル「HistoAge」を開発した。
Acta Neuropathologicaに発表された同研究では、献体から採取された海馬部位の700枚近くのデジタル標本をもとに、脳の年齢を推定するアルゴリズム「HistoAge」を構築した。同モデルは、脳年齢を平均で5.45年の誤差範囲内で識別する。またHistoAgeの解析から、認知機能障害や脳血管疾患、そしてアルツハイマー病に関連する変性タンパク質の蓄積、といった因子と、脳加齢の加速との間に有意な相関が存在することを確認している。
本研究を率いたKurt W. Farrell博士は、「ヒトの脳組織標本にAIのような最新の計算手法を適用することは、疾患評価方法のパラダイムシフトとなる。HistoAgeモデルは老化と神経変性のメカニズム発見の道を拓く一例に過ぎず、AIを活用する機会は拡大していくだろう」と語った。
参照論文:
Histopathologic brain age estimation via multiple instance learning
関連記事:
脳年齢を睡眠時の脳波で予測するAI研究
心臓年齢を予測するAIツール研究
「網膜年齢」による疾患予測
CTレポートの偶発所見から肺がんリスク症例を抽出するAI
COVID-19パンデミックはCT検査を受ける機会を増加させ、診断レポートには、偶然発見された肺結節が数多く記録された。これら結節の多くは良性だが、一部にはがんのリスクが潜んでいる。ブラジルの研究機関 INSTITUTO D´ORの研究者らは、ポルトガル語のCT検査レポートから、肺がんリスクのある偶発結節の記録を抽出する自然言語処理(NLP)ツールを開発した。
JCO Global Oncologyに発表された本研究では、2020-2021年に実施された21,500件以上の胸部CT報告書を分析し、その中から484件の偶発結節症例を、NLPツールの訓練データとして使用した。本研究では、がんリスクのある肺結節を、「4mm以上で肺炎など別の臨床的背景のないもの」と定義し、報告するようプログラムしている。結果、300件の外部コホートを用いた検証では、レポートからの検出精度は98.6%を達成した。
484件の偶発所見のうち、8名が肺がんと診断されて早期治療を受けることができた。そのうち2件は、NLPツールなしでは見逃されるリスクがあった、と研究チームでは考察している。著者のRosana Rodrigues氏は、「医師が別の疾患の仮説に集中しているため、偶発所見は見落とされやすく、初期の解釈のまま詳細には疑わない可能性がある」と語り、多忙な臨床現場で失われる可能性のあるがん診断をサポートするAIツール開発の意義を説明している。
参照論文:
Natural Language Processing for the Identification of Incidental Lung Nodules in Computed Tomography Reports: A Quality Control Tool
関連記事:
画像解析AIの性能向上に読影報告書を活用
...
ウイルス変異を予測するAIツール
米ハーバード大学と英オックスフォード大学の研究者らが開発した「EVEscape」と呼ばれるAIツールは、新型ウイルスが出現する以前にこれを予測することができる。
11日、Natureから公開された研究論文によると、EVEscapeには2つの要素があるという。ウイルスに起こりうる変化を予測する進化配列モデルと、ウイルスに関する詳細な生物学的・構造的情報だ。これらを組み合わせることで、EVEscapeは「ウイルスが進化する際に最も起こりそうな変異体」について予測を立てることができる。このツールは、SARS-CoV-2だけではなく、HIVやインフルエンザを含む他のウイルスについても正確な予測を行ったとしている。
研究者らは現在、EVEscapeを使ってSARS-CoV-2を予測し、今後懸念される変異型を予測している。最終的には、得られた情報は「より効果的なワクチンや治療法」を開発することに役立つ可能性が高い。
参照論文:
Learning from prepandemic data to forecast viral escape
関連記事:
将来的なウイルス感染症対策としての「AIトリアージプラットフォーム」
Opteev社「ViraWarn」 – 呼吸器感染ウイルスを呼気から検出
生成AIがCOVID-19治療薬の創出を加速させる
レビュー論文 – メンタルヘルスにおけるNLP
Translational Psychiatryにこのほど掲載されたレビュー論文では、「自然言語処理(NLP)を用いたAIベースのメンタルヘルス向けツール」に関して、システマティックレビューとメタアナリシスを行っている。
うつ病や不安障害などの神経精神疾患は、医療制度に大きな経済的負担を与えており、2030年までに世界で年間6兆米ドルにも達すると推定されている。一方、臨床人材は乏しく、メンタルヘルス評価のための広範な訓練が必要であるにも関わらず、利用可能な治療の質にはばらつきがあることも課題となってきた。研究チームは、Pubmed、PsycINFO、Scopusの各データベースで論文をスクリーニングし、精神的な健康評価に向けたNLP利用に焦点を当てた研究を特定した。
最終的なサンプルセットは102の研究で構成されたが、これらの研究の54%が2020年から2022年の間に発表されたものであり、同領域におけるNLP手法の急増を示唆している。言語表現に最も多く使用されたのはWord Embeddingsで、全体の半数近くで利用されていた。最も一般的なNLPモデル機能は、語彙と感情分析となっていた。
全体として、NLP手法はメンタルヘルスへの十分な適用可能性を持つことを強調している。さらに著者らは、特徴的な貢献を1つのフレームワーク(NLPxMHI)に統合することを提案しており、情報学と臨床の研究者が協力し、メンタルヘルスサービスの革新のための新しいNLPアプリケーションの可能性までを概説している。
関連記事:
Natural language processing for mental health interventions: a systematic review and research framework
関連記事:
Apple Watchによるメンタル評価
WHO研究 – メンタルヘルスにおけるAI応用と課題
メンタルヘルスケアにおける「コンテンツレコメンド」
救急部の胸部X線読影における生成AIの可能性
「救急部門における迅速な臨床データの解釈」は効率的な患者ケアに不可欠である。現行のプロセスでは、放射線科が救急部の胸部X線読影をダブルチェックすることで、多くの問題を回避している。米ノースウェスタン大学の研究チームは、救急部における胸部X線読影レポートの精度と質を、生成AIと放射線科との間で比較検証している。
JAMA Network Openに発表された同研究では、500枚の胸部X線画像および読影レポートのデータセットを用い、読影レポートを生成するAIツールの能力を評価した。結果として、AIによる読影レポートは、放射線科医によるものと同等のテキスト品質および正確性を持っていることを確認した。さらに、そのテキスト品質は、遠隔読影の品質を上回るとしている。
独立型の救急部では、24時間体制での放射線科からのサポートは困難であり、多くの施設が遠隔読影サービスを活用している。本研究は、生成AIツールの使用が、救急診療を迅速かつ効果的に支援し、医療サービスの合理化に貢献する可能性を示唆している。
参照論文:
Generative Artificial Intelligence for Chest Radiograph Interpretation in the Emergency Department
関連記事:
救急部における画像解析AI利用の価値
ChatGPT – 救急外来の鑑別診断で医師と同等のパフォーマンス
DNP – 「AI支援胸部がん検診読影システム」の運用を開始
LLMが論文レビューを自動化する
arXivに投稿された最近の研究論文では、大規模言語モデル(LLM)を利用し、「科学論文に対する有用なフィードバックを生成すること」を目的としたツールを開発し、検証している。
研究論文によると、Generative Pre-trained Transformer 4 (GPT-4)フレームワークに基づくこのモデルは、科学原稿をPDFとして取り込むことで一連の処理ができる。モデルは、論文審査プロセスの4つの重要な側面である、1.新規性と重要性、2.採用の理由、3.不採用の理由、4. 改善提案を出力することができる。大規模な系統的分析の結果、提供されたフィードバックにおいて、当該モデルが人間の研究者と同等の評価性能であったことを強調している。フォローアップの前向きユーザー調査では、アプローチした研究者の50%以上が「提供されたフィードバックに満足」しており、82.4%の研究者が「GPT-4のフィードバックは人間の査読者から受けたフィードバックよりも有用である」と回答していたという。
本研究成果は、科学的レビュープロセスを自動化できる可能性を示すもので、また、LLMは研究の初期段階において有用なフィードバックを加えることで、研究自体の質的向上に資する可能性も示している。
参照論文:
Can large language models provide useful feedback on research papers? A large-scale empirical analysis
関連記事:
GPT-4は医療ソフトスキルで医師を上回る?
OSCE-GPT – 医学生向け患者コミュニケーション教育アプリ
ChatGPT...
AI生成コンテンツに対する消費者の受容性研究
AIの生成したコンテンツをユーザーがどのように受け入れるか、心理的側面への関心が高まっている。米マサチューセッツ工科大学(MIT)スローン経営大学院の研究チームは、「生成AI、人間、あるいは双方の組み合わせで生み出されたコンテンツを消費者がどのように受け止めるか」を調査し、興味深い結果を得ている。
SSRNでプレプリント版が公開されている同研究では、小売製品の販売促進コピー、および社会的キャンペーンメッセージ(「ジャンクフードを食べ過ぎない」など)を、生成AI、人、両者の協働によって作成し、そえぞれの評価を消費者に求めた。その結果、興味深いことに、コンテンツの背後にいる作成者が公開されている場合、消費者は「人間が生成したコンテンツに肯定的となる傾向」が確認された。また、作成者が分かっている場合には、「AI生成のコンテンツに嫌悪感を示さない」ことも明らかになった。一方、作成者の情報が不明な場合、AI生成コンテンツが好まれる傾向もみられた。
AIと人の生成物が比較される中で、従来の調査からはいわゆる「アルゴリズム嫌悪(algorithmic aversion)」がよく知られていた。しかし、本研究では、AIが嫌悪されているのではなくむしろ「人間が贔屓されている(human favoritism)」という側面を強調している。著者のYunhao Zhang氏は「本研究が最も直接的に示唆するのは、『コンテンツがAIの生成物かどうか消費者はまったく気にしていない』ということだ。同時に『人間がどこで関与したか』を知ることには大きなメリットがある。そのため、企業は人間を完全に排除した自動化を追究すべきではない」と語っている。
参照論文:
People’s Perceptions (and Bias) Toward Creative Content generated by AI (ChatGPT-4), Human Experts, and Human-AI Collaboration
関連記事:
最新医療テクノロジーに対する世代別の受容性調査
ユーザーは「人間味ある健康アプリ」に信頼を寄せる
消費者は「生成AIによるコンテンツ」を信頼する
GPT-4は医療ソフトスキルで医師を上回る?
Scientific Reportsに掲載された最近の研究により、米マウントサイナイ医科大学などの研究者らは、米国医師免許試験(USMLE)のソフトスキルにおけるGenerative Pre-trained Transformer-4(GPT-4)とChatGPTの性能を評価した。
USMLEでは、医学知識だけではなく、複雑なシナリオをナビゲートする能力、患者の安全性への配慮、迅速で倫理的かつ法的に妥当な判断力が測定される。本研究では、人間的判断力、共感力、その他のソフトスキルに関するUSMLEの問題において、GPT-4とChatGPTのパフォーマンスを評価した。USMLEの要件を満たすようにデザインされた80問を使用している。問題の出典は、USMLEの公式サイトで公開されているステップ1、ステップ2、CK、ステップ3のサンプル問題となる。結果、両モデルとも正解率は十分に高く、特にGPT-4の性能はChatGPTよりも優れており、ChatGPTの正解率62.5%に対し、GPT-4は90%に達していた。
研究者らは「GPT-4は、プロフェッショナリズム、倫理的判断、共感を必要とする質問に効果的に取り組むことができる」としている。本研究において、ChatGPTが最初の回答を修正する傾向があることは興味深く、ChatGPTはGPT-4に比べ、柔軟性と適応性を重視し、多様な相互作用を好むように設計されていることを示唆する可能性がある。
参照論文:
Comparing ChatGPT and GPT-4 performance in USMLE soft skill assessments
関連記事:
ChatGPT – 救急外来の鑑別診断で医師と同等のパフォーマンス
ChatGPT – サウジアラビア医師国家試験を攻略
臨床ワークフロー全体を通じた「ChatGPTの有用性」
Boston Medical Sciences – シードラウンドで4億円を調達
ハーバード大学医学部、およびマサチューセッツ総合病院で教員・研究者を務める医師が2023年4月に設立した、Boston Medical Sciences株式会社(本社:東京都中央区、代表取締役:岡本将輝)は、Beyond Next Ventures株式会社(本社:東京都中央区、代表取締役:伊藤毅)から第三者割当増資を実施したことを明らかにした。また、新エネルギー・産業技術総合開発機構(NEDO)が提供する2023年度「ディープテック・スタートアップ支援事業(STSフェーズ)」にも採択され、エクイティ・助成金を合わせて総額4億円規模の資金調達となる。
大腸がんは国内がん種別罹患数1位、死亡数2位を占め、これらの数は増加し続けている。世界的にも巨大な疾病負荷を持つこの大腸がんによる死亡は、早期発見と早期医療介入により十分に回避することが可能であるにもかかわらず、「精密検査を受けることへの抵抗感」が最大の障壁となっている。大腸がんの精密検査は、多量の下剤服用が必要であること、内視鏡の挿入、検査準備および検査時間の長さなどによって、多くの要精密検査者に忌避される傾向にある。
Boston Medical Sciences社はAIの研究開発、医療画像解析、臨床医学への強力な技術・経験をバックグラウンドとして、「下剤不要のバーチャル内視鏡検査システム」である「AIM4CRC」を世界で初めて、日本から臨床実装することを目指す。身体的・精神的侵襲性の低い高精度検査を実現し、精密検査忌避者を検査の場に呼び戻すことで、大腸がんによる死を根絶することが同社の願いだ。
調達資金の使途は、1. 特許出願済みのコア技術をベースに、さらなる高精度化とプロダクト化に向けた研究開発、2. 臨床検証と共同研究の推進(ハーバード大学医学部/マサチューセッツ総合病院 3D Imaging Researchを含む)、3. エンジニア/リサーチャーの採用強化、4. 薬事・QMS/臨床開発の採用強化、となる。
Boston Medical Sciences社は「早期発見・予防の力で世界から大腸がん死をなくす」という理念の下、研究開発およびビジネス戦略のプロフェッショナルらが集い、最速・最短での当該技術の臨床実装を推進する。
Beyond Next Ventures パートナー・執行役員 橋爪克弥氏コメント:
日本でも数千万人規模で未受診とされる大腸がん検査の負担を軽減し、早期発見・早期治療の促進によって大腸がんによる死の根絶を目指す同社のビジョンに深く共感し、Boston Medical Sciences社へ新規出資を行いました。医師起業家である岡本氏と3年前に出会い、医療×AIに関する深い知見、研究・臨床・事業へのバランス感覚、周りを巻き込む人柄や行動力に惚れ、一緒に仕事をしたいとずっと思っていたので、この機会をとても嬉しく思います。大腸がん罹患数が日本で1位ということは、自分の家族や親戚、友人などまわりの誰かが罹患する可能性が高いとも言えます。数年後には同社の技術が社会に実装されはじめ、10年後には大腸がんの発症率が低下し始める未来を信じ、岡本社長、そしてBoston Medical Sciences社のチームとともに私も創業メンバーとして関わってまいります。
【Boston...
胸部X線AIモデルが示す人種間と性別間のバイアス
医療画像AIを利用した疾患検出技術について、多方面での研究開発が進むが、「トレーニングデータにおける患者背景の網羅性の不足」が問題となっている。英国のインペリアル・カレッジ・ロンドンの研究者らは、胸部X線AIモデルに潜む人種および性別に関するバイアスの存在を浮き彫りにし、今後の臨床応用への課題を示した。
Radiology: Artificial Intelligenceに発表された同研究では、インドと米国から得られた80万枚以上の胸部X線画像を用いて構築された最新の胸部X線AIモデルの性能を詳細に検証した。バイアス解析の結果、性別間に加え、アジア系および黒人患者において、疾患検出の精度に有意な差が存在することが確認された。具体的には、女性患者においては「所見なし」の分類精度が6.8-7.8%低下し、黒人患者における「胸水」の検出精度が10.7-11.6%低下していたという。
研究責任者であるBen Glocker博士は、「データセットの大きさだけでは公正なAIモデルの構築は保証できない。多様性と代表性を確保するため、データの収集段階から細心の注意が必要だ。AIはブラックボックスと思われがちだが、箱を開けて機能を検査することは可能だ。データセットを収集する際には、その初手から、全てのユーザーにとって有益な方法でAIが使用されていることを保証する必要がある」と語った。
参照論文:
Risk of Bias in Chest Radiography Deep Learning Foundation Models
関連記事:
医療画像処理AI開発における「29の潜在的バイアス」
少数派コミュニティのための責任あるAI実装
医療AI研究に欠ける「著者の多様性」
「短時間のちょっとした運動」が健康につながる
階段の上り下りから、床のモップがけに至るまで、日常における「短時間のちょっとした運動」が健康転帰の改善につながることを、シドニー大学の研究者らが明らかにした。
The Lancet Public Healthから今月公開された研究論文によると、中等度以上の強度で行われる10分未満程度の短い運動が、主要な心臓イベントおよび全死亡を有意に減少させるという。これは2.5万人以上を追跡した新しいウェアラブル研究の成果となる。UKバイオバンクの手首装着型ウェアラブルデバイスデータと機械学習アプローチを用い、42歳から78歳の英国成人25,241人において、身体活動パターンを10秒間の超短時間ウィンドウまで分析した。結果、少なくとも1~3分間継続的に動くことは、1分未満の非常に短い運動よりも有意に有益であった。また、総活動量に関係なく、運動時間は長いほどよい(例えば、30秒よりも2分)。また、各運動における活発な活動の割合が高ければ高いほど良く、少なくとも運動時間の15%(1分あたりおよそ10秒)をハアハアと息をつく程度の運動が含まれていればより効果的となる。
日常生活活動を通じて中程度から強度の活動を短時間で行うというアイデアは、計画的な運動を躊躇する、あるいはできない人々にとって、有効な身体活動をより身近にするものだ。研究結果は、短時間であっても活発な活動を含むこと、またそれが少しでも長いことによって利得が得られることを示している。
参照論文:
Brief bouts of device-measured intermittent lifestyle physical activity and its association with major adverse cardiovascular events and mortality in people who...
心的外傷後ストレス障害におけるAI診断の展望
心的外傷後ストレス障害(PTSD)の診断は、その多様かつ複雑な臨床的特性によって診断の難易度が高く、機械学習技術を利用した診断補助手法の採用が期待されている。カナダ・アルバータ大学の研究者らは、AIを用いたPTSDの自動診断手法に関するシステマティックレビューを実施した。
npj Mental Health Researchに発表された同研究では、最終解析の対象となった41件の論文をレビューする過程で、サポートベクターマシン(SVM)が12件と最も広く採用されていることを明らかにしている。古典的なモデルであるSVMは、中小規模のデータセットに適した性能と、計算処理の要件が少ない点で、研究者の間で好まれ続けている。一方で近年、ディープラーニング(DL)モデルの採用が増加している背景には、音声・映像・テキストの複雑なデータに対する優れた特徴選択能力があることから、PTSDの診断においても特に有効性を示していることが理由に挙げられている。
このレビューを通じ、研究チームでは「PTSDにまつわる診断の難しさから、これまで汚名を着せられ適切な精神科医療を享受できなかった患者に対し、費用対効果と信頼性の高い迅速な診断アプローチを提供できる可能性がある」とAI技術の重要性を強調している。
参照論文:
Systematic review of machine learning in PTSD studies for automated diagnosis evaluation
関連記事:
音声テキストのみでPTSDをスクリーニングするAI研究
臨床ルーチンデータからPTSD発症リスクを推定する機械学習モデル
外傷性脳損傷後のPTSD発症を予測する脳バイオマーカー
NIH – 腎移植AIで280万ドルを助成
米フロリダ大学の研究者らは、腎移植の転帰改善に資する「AIベースの臨床意思決定支援システム」の開発について、米国立衛生研究所(NIH)から280万ドル(4.2億円)の研究助成金を得たことを明らかにした。
公表によると、これは5年間に及ぶプロジェクトの一環として「AIモデルが腎移植患者の診断、予後予測、ケア管理をどのように支援できるか」を検討するもの。具体的に開発中のAIツールの1つには、患者データと腎臓組織サンプルの分析から、移植転帰を予測するものがある。転帰を正確に予測する能力は、臓器の入手可能性と臓器拒絶反応という、移植医療に影響を与える重大な問題のいくつかに対処する可能性を秘めている。
フロリダ大学インテリジェント・クリティカル・ケア・センターの画像処理部門で副部門長を務めるPinaki Sarder博士は、「我々の課題は、医師が最良の情報に基づいた判断を下せるよう、最も一貫性のある医療情報を提供するシステムを開発することだ」と語っている。
関連記事:
米臓器移植ネットワーク – 肺移植の割り当てを公平化する新システム
OrCA – 移植臓器の質を評価するAIプロジェクト
心臓生検の病理画像から移植拒絶反応を評価するAI
HoneyNaps「SOMNUM」 – 睡眠障害解析AIでFDA承認
睡眠障害の検査として広く知られる睡眠ポリグラフ検査は、睡眠中の脳波、呼吸、眼球や四肢の動きなどの多岐にわたる生体信号を精密に記録する手法である。これらのデータの専門的解析は、1件あたり数時間を要することもあり、労力と時間の面での課題が指摘されてきた。韓国のHoneyNaps(過去記事参照)は、睡眠障害解析のためのAI「SOMNUM」が米食品医薬品局(FDA)の認可を取得したと発表している。
SOMNUMのAI技術は、従来のビデオ画像ベースで信号を読み取るシステムに比べ、睡眠中の生体信号のリアルタイム解析において著しく高い能力を持つことが示されている。その成果は、直近の国際学会 Sleep 2023でも発表されている。睡眠中の複雑な生体信号に関して、人間の解析レベルに匹敵する結果をAIが出力することは、非常に高い技術的課題を伴うとされてきた。
HoneyNapsのCEOであるTae Kyoung Ha氏は「当社は米国市民を含む400名の被験者を対象とした臨床試験を検証段階から実施し、3年の歳月をかけてFDAの審査を通過した。このFDA承認を契機として、循環器疾患や神経筋疾患の診断機能の追加など技術を強化し、世界市場への展開をさらに加速したい」と語った。
関連記事:
韓国HoneyNaps社 – 睡眠ポリソムノグラフィ解析AI「SOMNUM」を発売
生理信号とハイブリッド学習に基づく睡眠障害検出
「睡眠障害の危険因子特定」へのAI利用
シンガポール国立大学病院「CalSense」 – 高カルシウム血症の自動検出AIツール
高カルシウム血症は、副甲状腺の機能異常やがん、薬物摂取、サプリメントの影響で生じることが知られている。発見が遅れると、不整脈や骨の障害、尿路結石、腎不全といった重大合併症に繋がるリスクがある。一方、検査項目の見落としや異常値への適切なアラートの不備が、臨床の現場で度々報告されている。この課題に対して、シンガポール国立大学病院(NUHS)では、高カルシウム血症の患者を即時検出するためのAIツール「CalSense」を開発・運用している。
NUHSによると、CalSenseは医療機関内の血中カルシウム値の結果をリアルタイムで監視し、高カルシウム血症の疑いがある患者にフラグを立て、ライブダッシュボードにて医師へと通知するもの。他の関連する検査項目も同時にチェックすることで、高カルシウム血症の原因をより正確に特定する機能を持つ。2023年の1月から7月までの試験運用で、26,000件の検査結果から1,600件の異常を検出したという。
NUHSの技術責任者であるNgiam Kee Yuan氏は、「CalSenseによって、検査結果が戻ってきた際に、医師が結果を手動で確認するプロセスが自動化される。これによって医療業務の事務負担が軽減され、より迅速な医療ケアを提供できるだろう」と語っている。
関連記事:
スマートフォンによる貧血スクリーニング
オーダリングシステムの再設計が検査リソースを節約
米国におけるAIツール導入の現状
がん治療向けクローズドループ療法の開発に4500万ドルを助成
米国医療高等研究計画局(ARPA-H)はこのほど、米国のがん関連死を50%以上削減できる可能性を持つというsense-and-respond implant技術を迅速に開発するため、4500万ドル(67.3億円)を授与した。
ライス大学が主導する7つの州の研究チームに対するこの助成は、卵巣がん、膵臓がん、その他の治療困難ながん患者に対する免疫療法の成果を劇的に改善することを目的とした、がん治療への新しいアプローチの開発とテストを迅速に進めるもの。sense-and-respond implant技術は、低侵襲手術で小さな装置を体内に埋め込むことで、病態変化を継続的にモニタリングし、投薬量をリアルタイムで調整する。このような「クローズドループ療法」は糖尿病の管理にも使われており、インスリンポンプと継続的に通信するグルコースモニターが知られている。一方、がん免疫療法では目新しく、革新的な成果をもたらす可能性がある。
共同研究者で、テキサス大学MDアンダーソンがんセンターの婦人科腫瘍学教授であるAmir Jazaeri氏は「腫瘍環境からのリアルタイムデータを提供することで、現状を一変させ、より効果的で詳細な腫瘍情報に基づいた新しい治療法を導くことができると信じている」と述べた。
関連記事:
がんナビゲーターを支援するAIモデル
OSAIRIS – 「がん放射線治療の待機時間」を短縮するAI技術
前立腺がん局所療法の治療成績向上を目指すAI研究
乳がん手術における腫瘍摘出精度を向上させるAI
米ノースカロライナ大学(UNC)外科やUNCラインバーガー総合がんセンターなどの研究チームは、乳がん手術中に「がん組織が体内から完全に除去されたかどうか」を予測できるAIモデルを構築した。研究成果はAnnals of Surgical Oncologyに掲載された。
外科医は病変部を切除した後、乳房内のがん周囲の健康な組織を少量採取する。この標本はマンモグラフィ装置で撮影され、異常部位が取り除かれていることをチームで確認する。その後、さらなる分析のために病理検査に送ることになる。病理医は、がん細胞が検体の外縁(病理学的マージン)まで広がっているかどうかを判断するが、切除した組織の端にがん細胞がある場合、乳房内にまだがん細胞が残っている可能性があるということになり、追加の手術が必要になることもある。しかし、検体マンモグラフィは手術室ですぐに行うことができるため、ここで高精度な判断がつくことは手術の迅速性とリソースの効率利用の観点から価値が大きい。
研究者らは、検体マンモグラフィ画像から「断端の陽性と陰性」を識別するAIモデルを構築した。数百枚の画像と病理医からの検体報告書から学習したモデルは、陽性断端の識別において人間と同等か、わずかに上回ることを示している。著者らは、このAIツールを用いることで、手術で摘出された腫瘍をリアルタイムでより正確に分析することができ、手術中にがん細胞がすべて摘出される可能性が高まるとして、さらなる研究と臨床利用の可能性を模索している。
参照論文:
Analysis of Specimen Mammography with Artificial Intelligence to Predict Margin Status
関連記事:
AI支援による乳がん検診の臨床的安全性評価
「AIアルゴリズムの組み合わせ」が乳がんリスクの長期予測に寄与
ATUSA – AI駆動による「ポータブル自動乳房3D超音波スキャナー」
AIチャットボットはおすすめの眼科医を案内できるか?
患者の治療転帰において、「適切な医師を選択すること」の重要性は数多くの先行研究により確認されている。近年、医師を選択する補助としてAIチャットボットを利用する患者の増加が注目されている。こうした背景を受け、米カリフォルニア大学サンディエゴの研究チームは、「AIチャットボットによる眼科医推奨の正確性と偏り」を検証している。
オープンアクセスジャーナル Cureusに発表された同研究では、調査対象として、米国内において人口の多い上位20都市を選び、3つの主要AIチャットボット(ChatGPT、Bing Chat、Google Bard)に対して、「その都市で良い眼科医を4人見つけてください」というプロンプトを与え、推奨された医師の特徴を検証した。結果的に、チャットボットによる推奨には顕著な不正確さと偏りが確認されている。特に女性眼科医の推奨割合の低さが認められ、全米の女性眼科医の割合が27.2%であるのに対して、Bing Chatの女性眼科医推奨は1.61%、Bardは8.0%と有意に低かった。他方、ChatGPTは29.5%で女性眼科医を多く推奨していた。さらに、各チャットボットは眼科以外の医師であったり、該当都市や周辺にいない医師を、かなりの割合(ChatGPT:73.8%、Bing Chat:67.5%、Bard:62.5%)で誤って推奨していることが明らかになった。
研究チームでは、米国内の主要20都市においてAIチャットボットによる眼科医推奨は、本研究で示されたような不正確さや偏りが伴う可能性があり、その利用拡大には注意が必要と結論づけている。
参照論文:
Bias and Inaccuracy in AI Chatbot Ophthalmologist Recommendations
関連記事:
「市民が抱く健康課題」へのChatGPTの回答能力
ワクチン接種事業におけるAIチャットボットの有効性
デリケートな健康問題はAIチャットボットへの相談が最適か?