このたびAudiokineticとReadSpeakerは、WwiseパイプラインへのspeechEngineの緊密なインテグレーションを実現しました。これによりデベロッパは、オンデバイスのテキスト読み上げ(TTS)ソリューションの機能と柔軟性をゲームで活かすことができます。speechEngine for Wwiseは、ゲーム開発ワークフローにシームレスにインテグレーションできるクロスプラットフォームのソリューションです。
speechEngineはランタイムに利用できるため、デベロッパは完全な制御のもと、リアルタイムでゲーム内テキストを音声に変換できます。UIナレーションや音声解説でアクセスしやすさを強化したい、マルチプレイヤーのやり取りに音声を追加したい、あるいはナラティブエクスペリエンス(物語性)を構築したい場合などに、デベロッパはspeechEngineを利用することでダイナミックで自然に聞こえる音声をゲームに追加できます。
オンデバイスの処理
speechEngineの強みはオンデバイスの処理にあります。CPUベースの計算フレームワークを利用することで、音声をデバイスでローカルに合成します。そのため、処理のいずれのステップにおいてもネットワーク接続が必要ありません。speechEngineは最適化された推論アルゴリズムと軽量なモデルを使用することで、CPUのシングルスレッドで音声を生成し、迅速なレスポンスタイムを実現します。また同テクノロジーはフットプリントも抑えられており、各ボイスエンジンに必要なメモリは10~15MB以下です。さらに各種プラットフォームでこのテクノロジーを利用できるため、クロスプラットフォーム展開が可能です。
オーサリングしてエクスポートし、ダイナミックに調整
Wwise向けのspeechEngineインテグレーションでは、ボイスコントロールパラメータがAuthoringインターフェースに直接追加されるため、ボイスのプロファイルやWwiseが提供する幅広いエフェクトを微調整し、ボイスのサウンドを細かくカスタマイズできます。 SoundBankにエクスポートすることで、ボイスエンジンをランタイムに制御できます。Wwise SDKからテキスト入力をプラグインに送信し、ボイスを再生すると、speechEngineが瞬時にテキストを読み上げます。またRTPCを使用してピッチやスピードなどを制御することも可能です。さらにきめ細かく制御するには、音声合成マークアップ言語(SSML)をテキスト入力として使用することで、より詳細にカスタマイズできます。
音声合成マークアップ言語(SSML)
SSMLでテキストの読み方をさらにカスタマイズできます。シンプルなマークアップ言語の構文であるSSMLを使用し、音声の特定部分を強調するなど多数のエフェクトを適用できます。以下にいくつかの例をご紹介します。
例1:「Listen carefully!」
<emphasis level=”strong”>Listen carefully!</emphasis>
Kayla(ケイラ)Molly(モリー)Sophie(ソフィー) |
|
例2:間を入れる
We are in dangerous territory <break time=”200ms”> proceed carefully from here on
Kayla(ケイラ)Molly(モリー)Sophie(ソフィー) |
|
例3:テキストの解釈の仕方を変更する
<say-as interpret-as="characters">wasd</say-as>
Kayla(ケイラ)Molly(モリー)Sophie(ソフィー) |
|
例4:単語を音素単位で規定する
Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>
Kayla(ケイラ)Molly(モリー)Sophie(ソフィー) |
|
利用可能なすべてのSSMLについては公式のW3C仕様をご覧ください:https://www.w3.org/TR/speech-synthesis/#S3.2.3
ボイスライブラリ
ReadSpeakerは40種類以上の言語に対応する115種類以上のボイスを含むライブラリにより、幅広いボイスオプションを提供します。 初回のspeechEngine for Wwiseプラグインリリースでは12種類の独特な音声のボイスを10種類の言語にてお届けします。また今後のリリースで言語やボイスの選択肢をさらに拡大していく予定です。
みなさまはspeechEngineをどう活用されますか?
ぜひspeechEngine for Wwiseをゲーム開発に活かしてください。当社とつながるには、Discordをご利用いただくか、メール(gaming@readspeaker.com)にてご連絡ください。
ReadSpeakerは、倫理的なAI搭載音声ソリューションの提供に取り組んでいます。同社のゲーム業界における倫理的なAI音声へのアプローチについては、こちらをご覧ください(英文)。
コメント