咳によるCOVID-19識別は困難?

英King’s College Londonの統計学者らが参加する研究チームは、「咳の音から新型コロナウイルス感染を正確に識別する機械学習ツールを構築するのは容易でない」との研究成果を明らかにした。研究者らはCOVID-19検出のための機械学習アルゴリズムを分析し、咳嗽音に基づいたものが、年齢や性別などの基本属性に自覚症状のみを加えたモデルよりも精度として上回らないことを指摘する

英国政府によるパンデミック対策の一環として、英国健康安全保障局から委託を受けた研究者らは「AI分類器をラテラルフロー検査の代替となるものとして使用できるかどうか」を調査した。より安価で環境破壊が少なく、より正確な検査が可能かを判断するため、COVID-19スクリーニングツールとしての咳嗽音に基づく機械学習アルゴリズムの性能検証を進めた。国家的なCOVID追跡プログラムを活用し、67,842人のPCR受検者(2.3万人超が陽性)から音声記録を収集して解析に用いている。各参加者は咳や呼吸、会話などを録音するよう求められ、これをベースとして構築した機械学習モデルは高い識別精度を示していた。

この事実は米マサチューセッツ工科大学(MIT)をはじめとする各種先行研究の結果と一致するものであったが、さらなる分析により、例えば「年齢、性別、症状が同じで、片方だけがCOVID-19である参加者を2人組にし、そのマッチングデータでモデルを評価すると、AIモデルは精度として著しく低下した」としている。データセットに含まれる新型コロナウイルス感染者のほぼ全員が何らかの症状を持っているため、モデルは「音声に症状がある場合はCOVID-19」、「呼吸器症状がない場合は非COVID」といった学習をしていた。結果的にCOVID-19症例数を過剰に診断してしまっており、これらのことは、採用バイアスによって引き起こされた交絡によるものと理解することができる。

英政府による追跡プログラムが有症状者だけを対象としたものであったために、サンプルが全体集団を代表するものではなかったことが問題の根幹であったとする。本研究はCOVIDスクリーニングに新しいソリューションを提供する種のものではないが、複雑で高次元のバイアスを特徴付ける新しい手法を導入し、採用バイアスを扱うためのベストプラクティス勧告を行うことに成功している。今後、音声ベースの分類器を構築・評価する場合、代表的な性能指標を得ることだけではなく、事前に交絡因子には強く配慮すべきであることを強調している。実際、バイアスを後になって発見するのは難しく、事後のコントロールも困難であることは多くのAI応用分野で確認されている。

参照論文:

Audio-based AI classifiers show no evidence of improved COVID-19 screening over simple symptoms checkers

関連記事:

  1. Hyfe – 咳のトラッキングでデジタルヘルスの未来を開拓
  2. 音声データからCOVID-19を検出するスマートフォンアプリ開発
  3. 機械学習により「禁煙に有効な既存薬」を特定
TOKYO analytica
TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。 The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。 1. 岡本 将輝 信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。 2. 杉野 智啓 防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事