自由記述からCOVID-19症状を正確に分類

医療現場における「フリーテキスト(自由記述)」は標準化データへの置き換えが容易ではないため、その情報量の多さに対してデータ活用の程度は限られている。ベルギー・アントワープ大学の研究チームは、電子カルテデータに含まれるCOVID-19関連の自由記述から、大規模解析を可能とする症状ベースの標準化データに分類するAIモデルを構築した。

JMIR Medical Informaticsから公表されたチームの研究論文によると、プライマリケアの現場における時間外診療データベースを利用し、症状ベースでの自由記述分類モデルの実現可能性を評価している。サンプルセットは3,957フィールドで構成され、2,313フィールドが研究に使用された。そのうち、85% (n=1,966) をモデルトレーニングに、15% (n=347) をテストに使用したところ、BERTによるディープニューラルネットワークアプローチが最も優れた性能を示していた(重み付けF1スコアとして0.70)。

著者らはこれらの結果を受け、「自由記述データをマイニングし、関連のある標準化された症状別データに変換するAIモデルを開発・使用することは現実的に可能で、今後積極的に進める必要がある取り組みだ」としている。適切な分類を受け、コード化された症状は、他のアルゴリズム開発や検証、病歴聴取と記録保持の質的評価、公衆衛生上の緊急事態におけるリアルタイム症状モニタリング、などへの幅広い活用が期待できる。

関連記事:

  1. XAIアプローチ – 電子カルテデータに基づく心臓アウトカム予測
  2. COVID-19は「臨床医が電子カルテに費やす時間」をさらに長くさせた
  3. 画像情報なしの電子カルテデータから肺がんリスクを予測

TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. 岡本 将輝
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員准教授など。専門はメディカルデータサイエンス。

2. 杉野 智啓
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事