医療とAIのニュース医療におけるAI活用事例最新医療AI研究ChatGPT - 米国泌尿器科学会の試験で低調な成績

ChatGPT – 米国泌尿器科学会の試験で低調な成績

各種専門医試験にChatGPTを挑戦させるといった「領域特化の回答能力検証」が続く中、米国泌尿器科学会(AUA)の自己評価プログラムに対してChatGPTの回答能力を試す研究が行われ、低調な正答率を記録したとする成果が報告された。

Urology Practiceで発表された同研究では、泌尿器科医の間で国際的に広く活用されているAUAの2022年セルフアセスメント型学習プログラム(SASP)において、ChatGPTが正答率30%に満たない試験結果を示した。その内訳は、画像関連の問題を除き、自由記述形式問題で36/135問(26.7%)、および多肢選択式問題で38/135問(28.2%)という正答率であった。特に自由記述形式問題へのChatGPTの回答は、SASPの模範解答より長い記述であったものの、冗長で内容が循環する傾向がみられた。

研究チームは、「米国医師国家試験(USMLE)のように事実を一対一で想起するような試験ではうまくいくが、複数の重複する事実・状況・結果を同時に考慮する臨床医学の問題においては、ChatGPTの回答能力は不十分」と指摘している。著者でネブラスカ大学医療センターのChristopher M. Deibert医師は「現状、泌尿器科領域におけるChatGPTの利用は、専門的なトレーニングを受けていないユーザーにとって、医学上の誤情報を助長する可能性が高い」と語った

参照論文:

New Artificial Intelligence ChatGPT Performs Poorly on the 2022 Self-assessment Study Program for Urology

関連記事:

  1. ChatGPT – 米国消化器病学会の試験には合格できず
  2. ChatGPT – 放射線科専門医試験で合格基準に到達
  3. 循環器科におけるChatGPTの回答能力検証
TOKYO analytica
TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。 The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。 1. 岡本 将輝 信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。 2. 杉野 智啓 防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事