Scientific Reportsにこのほど掲載された研究では、糖尿病患者の肝炎検出に関して、様々な機械学習モデルの性能が評価されている。
糖尿病は広く蔓延する慢性代謝性疾患の1つである。1型糖尿病(膵β細胞からのインスリン不足)と2型糖尿病(インスリン抵抗性)の別を問わず、この疾患は長期的に多臓器の合併症を引き起こしやすいことが知られている。最近の研究では特に、糖尿病患者におけるB型肝炎ウイルス(HBV)およびC型肝炎ウイルス(HCV)の有病率が高いことが報告されている。
韓国・建陽大学校などの研究チームは、身体計測結果、属性情報、脂質プロファイル、アンケートデータを用いて、糖尿病と肝炎における12の危険因子との関係を明らかにした。1,396人の糖尿病患者における解析によって、RF、SVM、XGBoost、LASSOという4つの機械学習モデルの識別性能を評価している。本研究で評価したすべての機械学習モデルは、ハイパーパラメータチューニング後に性能の向上を示したが、糖尿病患者におけるHBVまたはHCV感染の発症に対する予測能力が最も高かったのはLASSOであった。同様に、慢性HBV感染患者における肝細胞癌の予測においても、LASSOが最も優れた性能を示していた。
高パフォーマンスモデルを組み合わせたアンサンブルの結果、スタッキングは予測のパフォーマンス指標を改善しないことが示された。検証結果は、本課題の臨床的意思決定におけるLASSOの応用に光を当てるとともに、研究チームは「肝炎リスクの高い糖尿病患者を同定するスクリーニング戦略を開発するための重要な知見を提供した」としている。
参照論文:
Machine learning for predicting hepatitis B or C virus infection in diabetic patients
関連記事: