構造化されていないフリーテキストとして提出される患者フィードバックには、臨床的にも有用な情報が豊富に含まれている可能性がある。一方で、これを解析するには人的リソースが過分に必要となるため、自然言語処理(NLP)と機械学習による解析処理の自動化が模索されている。
英インペリアルカレッジロンドンの研究チームは、「フリーテキストの患者フィードバック解析にNLPを用いた先行研究群」をまとめたシステマティックレビューを明らかにしている。研究論文はBMJ Health & Care Informaticsから、このほど公開された。チームは、2000年から2019年までの20年間においてこの種の先行研究を調査したところ、論文の選択基準を満たしたのは19報で、その大部分(80%)がソーシャルメディアサイトからの患者フィードバック解析であったという。また、ソーシャルメディアから抽出されたコメントの解析には教師なしアプローチが用いられ、構造化調査におけるフリーテキストコメントについては教師ありアプローチが用いられていた。また、最もパフォーマンスの高い分類器としては、サポートベクターマシンとナイーブベイズが同定されている。
研究チームは「教師あり・教師なしのいずれものアプローチが、データソースに応じた役割を持つこと、NLPとAIの組み合わせは、非構造化テキストデータの効率的な解析を通して実臨床を支援し得る」ことに言及している。
関連記事:
電子カルテの自然言語処理で患者の社会的孤立を検出する取り組み