カナダ・バンクーバーに所在するブリティッシュコロンビア大学の研究チームは、自然言語処理(NLP)アプローチにより、腫瘍内科医による初期の診断文書のみを用いて「がん患者の生存」を予測できるとする研究成果を公表した。追加データを一切用いることなく、多様ながん種に対して高精度な予測を実現しており、NLPの有効な医療応用事例として関心を集めている。
JAMA Network Openから公開された研究論文によると、2011年4月から2016年12月までに、カナダのブリティッシュコロンビア州の6つの病院でがん治療を開始し、診断から180日以内に腫瘍医による診察文書が作成された47,625人の患者を対象として、レトロスペクティブに臨床データを収集している。患者予後については6ヶ月、36ヶ月、60ヶ月で生存しているか、生存していないかを示すバイナリラベルを作成し、初期診断文書からこれを予測するモデルを構築した。検証の結果、モデルの平均AUCは6ヶ月予測で0.928、36ヶ月予測で0.918、60ヶ月予測で0.918と、高い予測精度を示していた。
本ツールは特定のがん種に依存せず、がん診断において必ず生成される1つの文書のみを複雑なデータ処理を加えることなく用いるため、臨床的に有用で現実的な生存予測システムの開発に結び付けられる可能性がある。研究チームはさらなる外部検証とモデル改善を継続する旨を明らかにしている。
参照論文:
関連記事: