ChatGPTが日常の診断ケースにどの程度有効に機能するか、多くの臨床医による検証が続けられている。オランダのイェルーン・ボッシュ病院の研究チームは、救急外来の症例を集め、ChatGPTが導いた鑑別診断の候補を医師と比較する研究を行った。
9月16日から20日まで開催のEuropean Emergency Medicine Congressで発表された研究では、同病院の救急外来患者30名の臨床情報をChatGPT(バージョン3.5および4.0)に入力し、生成された鑑別診断の候補リストを、救急医が作成したリスト、そして正しい診断結果1つと比較検討した。その結果、ChatGPTと救急医による診断リスト間で約60%の一致が確認された。また、診断可能性の高い上位5つまでに正しい診断が含まれていた割合は、ChatGPTのバージョン3.5で97%、バージョン4.0で87%、救急医で87%であった。
研究を主導したHidde ten Berg氏は、「この結果は、ChatGPTが医師と同様の鑑別診断を提案できたことを示している。プライバシーに関する懸念はあるものの、救急外来の待ち時間短縮や、経験の少ない医師のサポート、さらには稀な疾患の検出において、技術の活用が期待できる」と語っている。
関連記事: