医療データベースに対してAIを活用した分析を行うことは、医療の将来にとって重要な役割を果たすと考えられている。しかし、従来の標準的に登録された医療データベースにAIを適用する限界が、米イェール大学のグループによる最新の研究で示された。
イェール大学のリリースによると、学術誌 JAMA Cardiologyに発表された研究では、米国心臓病学会(ACC)の胸痛-心筋梗塞レジストリ(Chest Pain-MI Registry)が利用されたという。これは、米国1,000以上の病院に入院した急性心筋梗塞と心臓発作患者100万人近くが含まれるレジストリで、従来主力とされてきた医療データベースにあたる。そこに3つの機械学習手法を適用し入院後の死亡を予測したが、古典的な統計学的回帰モデルであるロジスティック回帰を用いた場合と比較して、機械学習モデルで得られる院内死亡率の識別力の向上はごくわずか(C統計量: ロジスティック回帰0.89 ・機械学習モデル0.90)という結果であった。
著者らは「医療の外で予測力に革命を起こした高度な機械学習手法も、大規模な全国レベルのデータベースでは死亡率予測を有意に改善できないことがある」とその限界について述べている。すなわち、従来型の限られた項目に対して手動で抽出されたデータベース形式では、高度な解析に必要な患者の特徴の多くを捉えきれていない可能性が高いということになる。AI/機械学習が可能性を発揮するかは「適切に構築されたデータセットかどうか」に強く依存するため、今後のデジタルデータ収集における方法を再考する必要があると、著者らは考察している。