がん治療において、大規模言語モデル(LLM)の応用は急速に進展している。米国コーネル大学やマサチューセッツ工科大学の研究チームは、LLMの「がんの臨床意思決定への応用」に関する文献を対象としたシステマティックレビューを実施し、npj Digital Medicineに掲載した。
研究者らは、PubMed、Web of Science、Scopus、ACM Digital Libraryを用いて、2024年5月までに発表された大規模言語モデル(LLM)のがんの臨床意思決定への応用に関する論文を網羅的に検索した結果、56件の論文を特定した。レビューの結果によると、55件(98.2%)でChatGPTが使用されていた。分析対象となったがんは、肺がん(11件)、乳がん(8件)、前立腺がん(7件)、子宮頸がん(7件)など、計15種類のがんが含まれていた。がんの意思決定支援の内容としては、治療計画、画像診断、予後や治療後のマネジメント、予防やスクリーニング、患者情報の要約などが含まれていた。治療計画の平均正答率は75.5%に対し、診断は67.4%と低く、研究間のばらつきが目立った。さらに、参加者属性や倫理審査の記載欠落、高所得国への偏在、公開データや評価基準の非標準化が、再現性と臨床適用の障壁となっていた。
LLMは大量の臨床ガイドライン、研究論文、患者情報などを統合し、個々の症例に応じたレコメンデーションを提供することができる。一方で、本レビューではバイアスの存在、実際の患者データの不足、一般化可能性や再現性の問題が課題として明らかにされた。研究者らは「LLMの開発および評価プロセスにおいて、臨床医や患者、その他多様なステークホルダーが参加することで、これらの重要な課題を克服できるだろう」と述べている。
参照論文:
Large language model integrations in cancer decision-making: a systematic review and meta-analysis
関連記事: