医療とAIのニュース医療におけるAI活用事例最新医療AI研究プロンプト設計でChatGPTの病歴要約能力が向上

プロンプト設計でChatGPTの病歴要約能力が向上

大規模言語モデル(LLM)のパフォーマンスは、「プロンプト」と呼ばれる指示文に大きく左右される。この課題に取り組むため、米スタンフォード大学とデューク大学の研究チームは、「プロンプト設計の改善を通じて、ChatGPTによる患者病歴要約の質を向上させる」という研究を行っている。

JAMA Internal Medicineにリサーチレターとして掲載された同研究では、タイプの異なる胸痛患者3例についてChatGPTによる病歴要約を試みた。初めに、各症例について10個の病歴要約を作成し、エラーの有無を確認し、プロンプトを修正する、というプロセスを2回実行した。最終ラウンドで生成された各病歴要約に対して、内科レジデントが作成した4つの病歴要約を比較の対象として、30名の内科医が盲験評価を行った。病歴の詳細度、簡潔さ、構成に関する合計15点の評価を行った結果、レジデントによる作成(平均12.18点)に対して、ChatGPTによる作成(平均11.23点)は、わずか1点未満の差しかなかった。なお、要約者がレジデントかChatGPTかの識別精度は61%であった。

初期の質の低いプロンプトでは、患者の年齢や性別など、ソースに存在しない情報を作り出す「幻覚(hallucination)」現象が観察された。研究チームは、LLMが臨床環境で安全に使用されるためには、臨床医とAI開発者が密接に協力し、堅牢で最適化されたプロンプトの設計が必要であると指摘している。

参照論文:

Comparison of History of Present Illness Summaries Generated by a Chatbot and Senior Internal Medicine Residents

関連記事:

  1. ChatGPTの医学的エビデンス要約能力
  2. 大規模言語モデルがEBMを推進する
  3. TachyHealth – 会話型AIによる医療コーディングシステム
TOKYO analytica
TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。 The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。 1. 岡本 将輝 信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。 2. 杉野 智啓 防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事