加齢によりAI合成音声の識別は困難に

AI合成音声は自動電話サービスやセルフレジ、会話型エージェントシステムなど、生活のあらゆる場面に現れるようになった。多大な恩恵の一方で詐欺に悪用される懸念などから、合成音声であることを人が識別できるかは重要となる。カナダで医療サービスを展開するBaycrestの研究チームは、「AI合成音声に対する年齢層別の知覚特性」を調査している。

International Journal of Speech Technologyに発表された同研究では、Googleの音声合成ソフトWaveNetを用い、若年層(〜30歳)と中高年層(〜60歳)の知覚特性を検証した。被験者にはAI合成音声がどの程度自然に感じられるかを尋ね、人間が話したものかAIが話したものかを識別させた。その結果、若年層と比較して中高年層は合成音声を自然と感じ、正確に区別できない傾向にあることが分かった。

本研究では、AI合成音声に対する識別能低下の要因について、難聴やAI技術への慣れを除外し、「音声に含まれる感情を認識する能力の低下」を仮説に置く。著者のBjörn Herrmann氏は「感情に関する情報を得る際、加齢に伴って、スピーチのリズムやイントネーションより、言葉そのものに注意を払うようになる。一般的にはAI合成音声を識別する際には、言葉の内容よりも、リズムやイントネーションの処理に依存している可能性が高く、このことが高齢層のAI合成音声識別能低下を説明するのではないか」と語る

参照論文:

The perception of artificial-intelligence (AI) based synthesized speech in younger and older adults

関連記事:

  1. 次世代の聴覚ケアにおける鍵はAIとスマフォ
  2. EarHealth – 耳の異常を検出するイヤホン型システム
  3. LUCID社 -「音楽を薬に変える」AIツール開発
TOKYO analytica
TOKYO analyticahttps://tokyoanalytica.com/
TOKYO analyticaはデータサイエンスと臨床医学に強力なバックグラウンドを有し、健康増進の追求を目的とした技術開発と科学的エビデンス構築を主導するソーシャルベンチャーです。 The Medical AI Timesにおける記事執筆は、循環器内科・心臓血管外科・救命救急科・小児科・泌尿器科などの現役医師およびライフサイエンス研究者らが中心となって行い、下記2名の医師が監修しています。 1. 岡本 将輝 信州大学医学部卒(MD)、東京大学大学院専門職学位課程修了(MPH)、東京大学大学院医学系研究科博士課程修了(PhD)、英University College London(UCL)科学修士課程最優等修了(MSc with distinction)。UCL visiting researcher、日本学術振興会特別研究員、東京大学特任研究員を経て、現在は米ハーバード大学医学部講師、マサチューセッツ総合病院研究員、SBI大学院大学客員教授など。専門はメディカルデータサイエンス。 2. 杉野 智啓 防衛医科大学校卒(MD)。大学病院、米メリーランド州対テロ救助部隊を経て、現在は都内市中病院に勤務。専門は泌尿器科学、がん治療、バイオテロ傷病者の診断・治療、緩和ケアおよび訪問診療。泌尿器科専門医、日本体育協会認定スポーツドクター。
RELATED ARTICLES

最新記事

注目の記事