米ハーバード大学医学部などの研究チームは、これまでに実施された「機械学習技術に基づく介入」のある無作為化臨床試験のほとんどで、既存の臨床試験報告ガイドラインであるCONSORT-AIへの遵守が無いことを明らかにした。研究成果はこのほど、JAMA Network Openから公表された。
患者ケアの多様な側面を改善し得る機械学習の可能性は広く注目されているが,臨床実装への障壁は小さくない。多くのケースで、無作為化臨床試験は「介入を大規模に臨床採用するための前提条件」となるが、機械学習技術による介入に焦点を当てた臨床試験の設計と実施、その報告に関して、重要な疑問が残っている。研究チームの研究論文によると、参入基準を満たした41件の臨床試験に関して系統的調査を加えたところ、「CONSORT-AIが示す基準の全て」を遵守する試験は1つもなかった。非遵守の項目としては、質の低いまたは利用できない入力データを評価していない(38試験、93%)、パフォーマンスエラーを分析していない(38試験、93%)、コードまたはアルゴリズムの利用可能性に関する記述を含まない(37試験、90%)など。また、全体のバイアスリスクは、7試験(17%)で「高度である」と評価された。
著者らは「ヘルスケア領域において機械学習ベースのアルゴリズムが多数開発されているにも関わらず、妥当な臨床試験が実施されていない事実を明らかにした」としており、既存の無作為化臨床試験における「報告基準の遵守とバイアスのリスク」には高いばらつきがあることを強調している。
関連記事: