北米放射線学会(RSNA)はMachine Learning Challengeと呼ばれるプロジェクトのもと、非営利目的での機械学習研究に対して無償でデータセットを提供してきた。2019年度同プロジェクトによって発表されたのは874,035枚に及ぶ多施設・他国籍の脳出血CTデータセットである。RSNAと米国神経放射線学会(ASNR)が協力し、合計60名のボランティアによって、5つの脳出血タイプ(くも膜下出血・脳室内出血・硬膜下出血・硬膜外出血・脳皮質内出血)でアノテーションが行われた。
学術誌 Radiology: Artificial Intelligenceにおいて、データセットについての論文が発表されている。今回のチャレンジがユニークで多大な労力を要したのは新規にゼロから作成された点にある。RSNAが2017年度・2018年度と過去2回提供したものは既存のデータセットを中心に構成されていた。主著者である米トーマス・ジェファーソン大学病院の神経放射線科教授Adam Flanders博士は、脳出血CT画像の量だけではなく、国際的に集められた画像は様々なメーカーの多岐にわたるCTで撮像されており、出所が不均一である点にも高い価値を主張している。
2つの米国を代表する学会は脳出血CTデータセットの価値を担保し、非商業的なAI研究コミュニティが自由に利用することを期待している。RSNAはかねてより医師主導のAI画像診断研究に対して先進的な姿勢を示してきた。プロジェクトに協力した多数のボランティアの献身によって、この領域の機械学習研究において今後何年にもわたって貴重なリソースとして活用されてゆくだろう。