妊娠高血圧腎症は蛋白尿を伴う血圧上昇で、妊婦に痙攣発作をきたす「子癇」を引き起こすことがある。子癇は速やかな治療がなされない場合致命的となるため、妊娠高血圧腎症の早期同定・治療開始は周産期管理の重要な要素と言える。ただし、原因が明確でないこと、危険因子と表現型が多岐に渡ること、などから効果的な早期予測は容易ではなかった。米スタンフォード大学の研究チームは、機械学習アプローチによってこの妊娠高血圧腎症を予測する統計モデルを構築した。
American Journal of Obstetrics & Gynecology MFMに掲載されたチームの研究論文によると、2014年4月から2018年1月に、カリフォルニア州スタンフォードに所在するルシール・パッカード小児病院で扱った16,370件の出産記録とそれに伴う妊産婦データを利用し、このアルゴリズムを導いたという。チームが用いた統計モデルは、Elastic NetとGradient Boostingの2つ。前者は、ridge回帰とlasso回帰で用いる正則化項のいずれもを使用する手法で、多重共線性(特徴量間に強い相関があり、推定が不安定になるケース)への対策として頻用される。後者はアンサンブル学習のひとつで、複数の弱学習器を逐次的に作り各々の予測結果を統合する手法で、特徴量の全てが重要でありながらridge回帰を含む通常の回帰がうまくいかない場合などに選択される。チームは在胎週数16週未満で入手可能なデータのみを利用し、母親の基本属性や既往歴、各種検査結果など計67の変数を考慮した。得られた最良の予測モデルではAUC 0.79(95%CI 0.75-0.83)、感度45.2%、偽陽性率8.1%であった。また、早期発症の妊娠高血圧腎症についてはAUC 0.89とより高い識別精度を示していた。
著者らは「ルーチンの妊娠初期情報から妊娠高血圧腎症のハイリスク者を高いパフォーマンスで予測することができる」と結論付けており、自動スクリーニングによる効果的な妊娠合併症管理を実現する可能性を強調する。