名前と場所から民族情報を予測する機械学習研究 -カナダの疫学データベースを補強

カナダは民族的な多様性のある移民の国として知られる。しかし、国内の大規模データベースに民族情報が不足していることが、民族間の健康要因を検討する際に公衆衛生学的課題とされていた。いわゆるアボリジニ(カナダ先住民であるファースト・ネーション、イヌイット、メティらの総称)が社会的不平等から健康上の課題を抱えている可能性は常に指摘がある。「民族情報を名前と居住地から機械学習アプローチにより予測する」研究がカナダ・アルバータ大学のグループによって査読つきオープンアクセスジャーナル PLOS ONEに発表されている。

アルバータ大学のニュースリリースでは同研究を紹介している。カナダにおける1901年の国勢調査にある480万人の「名前」と「位置情報」を分析する機械学習フレームによって、その個人が13の民族グループのいずれに属するかを予測した。民族・言語グループによって、名前の響き・文字数・母音の数・固有の文字列などに特徴が現れることに着目している。名前だけでも特に中国人・フランス人・日本人・ロシア人にルーツをもつ個人の識別に優れたパフォーマンスを発揮できたが、アボリジニについては位置情報も含めることで予測精度が向上した。

筆頭著者のWong氏によると「米国の医療記録には民族情報に関する質問が含まれる傾向があるが、カナダのデータベースでは一貫して収集されていない」という。Wong氏は特に多民族性の強いノースウエスト準州で疫学調査ポストに就いていた際、先住民の健康に影響を与える医療の社会的不平等に関心をもった。費用と時間を要する国勢調査レベルのものを新たに実施するより、同研究のアプローチでは既存の記録から多くのことを学べる点に優位性がある。将来的にはカナダの疫学調査において、同研究のような民族性で補強されたエビデンスが応用されていくことを研究グループは期待している。

前の記事がん患者へのAIによるリスク層別とその経済効果
次の記事AIは投薬のエラーを予防できるか?
TOKYO analytica
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。
The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。

1. M.Okamoto MD, MPH, MSc, PhD
信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、ロンドン大学ユニバーシティカレッジ(University College London)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員を経て、東京大学特任研究員など。専門はメディカルデータサイエンス。

2. T.Sugino MD
防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。