睡眠の質を評価し、関連する健康リスクを低減するには、睡眠段階を正確に分類することが重要となる。 しかし、従来のポリソムノグラフィー(PSG)解析では、多数の生理信号(EEG、EOG、EMGなど)を用いて専門技術者が手作業で分類を行うため、多大な時間と労力が必要であり、判定者間のばらつきも課題とされてきた。
韓国の研究チームは、睡眠段階分類に特化した機械学習モデル「SleepXViT」を開発し、その成果をNatureの関連誌であるnpj Digital Medicineで発表した。このモデルは、PSG信号画像を用い、Vision Transformer(ViT)をベースにした2段階構造を採用している。1つ目は単一の画像(30秒間のPSG信号画像)から特徴を抽出する「Intra-epoch ViT」、2つ目は連続した複数の画像を解析し、時間的文脈を考慮する「Inter-epoch ViT」で構成される。大規模なKISSデータセット(7,745件)やSHHSデータセットを活用した結果、SleepXViTは分類精度(MacroF1スコア:81.94)で従来モデルを上回る成果を示した。さらに、各分類結果の信頼度を示すConfidenceスコアや、分類に影響を与えた特徴領域を可視化するヒートマップを提供することで、臨床現場での実用性を高めている。
著者らは「SleepXViTは高精度な分類能力に加え、結果の透明性と解釈性を兼ね備えており、臨床医の補助ツールとして有用である」と述べている。また、将来的には、多施設からのデータ収集やモデル改良を通じて汎用性を高め、睡眠医療全体の質を向上させる可能性が期待される。
参照論文:
Explainable vision transformer for automatic visual sleep staging on multimodal PSG signals
関連記事: