医療データをAIツールなどの個別化医療技術に適用する際、データの偏りによる意図しない影響については繰り返し報じてきた(過去記事)。ツールの精度と適切な一般化可能性を確保するため、いかにして多様な患者集団からデータを収集していくか、各機関での取り組みが続く。
米ミシガン大学のリリースでは、「大規模バイオデータバンク構築の適正化」を調査した研究を紹介している。本研究成果はHealth Affairs誌の12月号に発表された。ミシガン大学の学術医療センターにおいて、手術を待機する患者に対して、「ミシガン・ゲノミクス・イニシアチブ」という研究用バイオバンクへ少量の血液を提供する研究参加が募集された。その登録患者の多様性に、募集と登録のアプローチがどう影響しているかが調査された。その結果、同センターにおける全患者集団と比較して、データバンク登録に同意した患者層は、年齢・性別・人種・民族・社会経済的因子の面で多様性が著しく欠如していることが明らかにされた。具体的には、手術待機患者の平均的な年齢よりも若く、黒人・アフリカ系アメリカ人・アジア系・ヒスパニック系の参加割合が乏しかったという。
データバンクの多様性は「どの患者が登録に同意するか」よりも「どの患者が募集に適するか」という面に大きな影響を受けてしまう、と研究チームは考察する。論文著者で、ミシガン大学医学部の研究倫理学者Kayte Spector-Bagdady氏は「大規模な研究データセットが米国内の患者多様性を反映しないことが多いのは分かっていたことだが、このような格差がどう根付いていくか今回の研究では詳細に分析した」と語っている。
関連記事: