Laerdal Medicalは、救命率向上に向けた医療教育ソリューションを提供する多国籍企業で、本部をノルウェーに置く。同社が開発を進める「看護学生向け3Dバーチャルトレーニングシミュレータ」は、Microsoftの「Azure AI to Speech」を活用することで、患者と看護師のやり取りをシミュレートする没入体験を提供する。
新型コロナウイルス感染症が急速に拡大するなか、Laerdalは同シミュレータの開発を開始した。リアルなシミュレーションを実現するためにポイントとなるのが「音声」で、当初は声優による録音を行っていた。一方、この作業は膨大な時間と手間がかかり、トレーニングプログラムのユースケースを拡大する明確な妨げとなっていたため、ボトルネック解消のために採用したのが、合成音声の作成支援システムだった。
Microsoft Azure AI Text to Speechをトレーニングプログラムに組み込むことで、小児科、母性、看護基礎などの看護教育モジュールのコスト削減と開発期間の大幅な短縮を実現したという。具体的には、テキスト入力からリアルな音声体験を実現するNeural Text-to-Speech (Neural TTS) を導入しており、Azure AIが提供するニューラル音声を使用することで、Laerdalは仮想患者や看護師の音声作成にかかる時間を2ヶ月から24時間未満に短縮することができた。
現在、Azure AIのNeural Text-to-Speechは、140の言語とバリエーションで400のニューラル音声が利用可能となっている。Laerdalでプロダクトマネージャーを務めるJesper Pærregaard氏は「もしAIボイスがなかったら、我々は仮想患者にこれほど多様な声のラインナップを提供することはできなかった」と話し、Azure AI to Speechのインパクトの大きさを明らかにしている。
関連記事: