現在米国で半数以上の病院に実装される敗血症予測ツールについて、「開発元が公表した予測精度を全く維持していない」事実が指摘された。米疾病予防管理センター(CDC)の推計によると、院内死亡患者の3人に1人が敗血症という現状があり、臨床医は敗血症リスクの程度とその早期発見、早期治療に強いモチベーションを持つ。臨床的意思決定をサポートする主要なシステムに疑問符が付いたことで、今後AIシステムの臨床的有効性、特に精度評価・管理において大きな議論を呼びそうだ。
ミシガン大学がこのほど明らかにしたところによると、評価対象となったのはEpic Systemsが提供する敗血症予測ツールで、実臨床現場において敗血症リスクを正しく識別したのは63%にとどまるという。これはEpic Systemsが報告する76-83%の予測精度と大きく乖離している。また、同ツールは全患者の5人に1人にアラートを出しており、全入院患者でみた場合、入院期間中の敗血症発症率を考慮すると、真の敗血症1例を見つけるために8人の被アラート患者を精査する必要があるという。これは臨床ワークフローおよび医療コストの観点から大きな負荷を与え得るもので、状況を看過することはできない点に言及する。
JAMA Internal Medicineから21日公開されたチームの研究論文によると、この精度低下はEpicのモデルが「敗血症発症を請求コードのみで定義付け」しているためであるとする。つまり、臨床的な敗血症発症とそのタイミングは多様で、保険請求コードだけでは適切に捉えられないというものだ。研究チームは臨床ソフトウェアツールに対する監視規制、およびガバナンスの強化を強く求めている。
関連記事: