電子健康記録(EHR)は、紙カルテを電子記録に置き換えたのみの一般的な電子カルテ(EMR)とは異なり、個人医療情報を医療機関横断的に収集・共有されるもので、2000年頃から欧米各国において実現されてきた。米ハーバード大学などの研究チームは、このEHRデータから肺がんコホートを設定し、高精度な予後予測モデルの生成が可能であることを示した。
JAMA Network Openに掲載されたチームの研究論文によると、1998年から2018年にかけてハーバード大学の関連病院を受診し、少なくとも1つの肺がん診断コードを持つ7.6万人以上のEHRデータに基づく成果をまとめた。機械学習アルゴリズムと自然言語処理ツールを利用し、構造化データおよび非構造化データから臨床情報を抽出した。これらから肺がん分類モデルと予後予測モデルを構築したところ、前者で94.4%の陽性的中率、後者については1~3年後予測でAUCはそれぞれ0.814を上回り、各モデルは優れたパフォーマンスを示していた。
研究成果は「EHRに基づく肺がんコホートは、大規模な縦断的臨床データから知見を抽出するための費用対効果に優れたアプローチとなる可能性が高い」ことを示しており、機械学習アルゴリズムの構築を前提とした疾患特異的なEHRデータ活用は、今後急速に拡大することが見込まれる。
関連記事: