英King’s College Londonの統計学者らが参加する研究チームは、「咳の音から新型コロナウイルス感染を正確に識別する機械学習ツールを構築するのは容易でない」との研究成果を明らかにした。研究者らはCOVID-19検出のための機械学習アルゴリズムを分析し、咳嗽音に基づいたものが、年齢や性別などの基本属性に自覚症状のみを加えたモデルよりも精度として上回らないことを指摘する。
英国政府によるパンデミック対策の一環として、英国健康安全保障局から委託を受けた研究者らは「AI分類器をラテラルフロー検査の代替となるものとして使用できるかどうか」を調査した。より安価で環境破壊が少なく、より正確な検査が可能かを判断するため、COVID-19スクリーニングツールとしての咳嗽音に基づく機械学習アルゴリズムの性能検証を進めた。国家的なCOVID追跡プログラムを活用し、67,842人のPCR受検者(2.3万人超が陽性)から音声記録を収集して解析に用いている。各参加者は咳や呼吸、会話などを録音するよう求められ、これをベースとして構築した機械学習モデルは高い識別精度を示していた。
この事実は米マサチューセッツ工科大学(MIT)をはじめとする各種先行研究の結果と一致するものであったが、さらなる分析により、例えば「年齢、性別、症状が同じで、片方だけがCOVID-19である参加者を2人組にし、そのマッチングデータでモデルを評価すると、AIモデルは精度として著しく低下した」としている。データセットに含まれる新型コロナウイルス感染者のほぼ全員が何らかの症状を持っているため、モデルは「音声に症状がある場合はCOVID-19」、「呼吸器症状がない場合は非COVID」といった学習をしていた。結果的にCOVID-19症例数を過剰に診断してしまっており、これらのことは、採用バイアスによって引き起こされた交絡によるものと理解することができる。
英政府による追跡プログラムが有症状者だけを対象としたものであったために、サンプルが全体集団を代表するものではなかったことが問題の根幹であったとする。本研究はCOVIDスクリーニングに新しいソリューションを提供する種のものではないが、複雑で高次元のバイアスを特徴付ける新しい手法を導入し、採用バイアスを扱うためのベストプラクティス勧告を行うことに成功している。今後、音声ベースの分類器を構築・評価する場合、代表的な性能指標を得ることだけではなく、事前に交絡因子には強く配慮すべきであることを強調している。実際、バイアスを後になって発見するのは難しく、事後のコントロールも困難であることは多くのAI応用分野で確認されている。
参照論文:
関連記事: