Google 大勢の会話から特定の音声をAIで抽出

Photo: iStockphoto
最新ニュース

Googleの研究者とスイスのイディアップ研究所は、プレプリント・サーバー「Arxiv.org」に掲載された新たな論文の中で、雑音の中から特定の会話を抽出する技術について発表した。研究者たちは、2つの個別のニューラル・ネットワーク(話者認識ネットワークとスペクトログラム・マスキング・ネットワーク)を訓練し、会話の抽出精度を高めたという。

今回の研究は、すでに発表されているマサチューセッツ工科大学(MIT)のコンピューター科学・人工知能研究所の論文に基づいて進めらた。同論文では、YouTubeの映像から個々の楽器の音を分離するAIシステム「PixelPlayer」について発表がなされていた。

今回開発された技術により、大勢の会話の中から特定の人物の声を抽出することが可能となり、これを応用することで、持ち主だけに音声応答するデバイスも開発可能になるだろうと関係者は述べている。