ReadSpeakerとAudiokineticがWwise向けspeechEngineをリリース:ランタイムのオンデバイステキスト読み上げソリューション

Wwiseの使い方やツール

このたびAudiokineticとReadSpeakerは、WwiseパイプラインへのspeechEngineの緊密なインテグレーションを実現しました。これによりデベロッパは、オンデバイスのテキスト読み上げ(TTS)ソリューションの機能と柔軟性をゲームで活かすことができます。speechEngine for Wwiseは、ゲーム開発ワークフローにシームレスにインテグレーションできるクロスプラットフォームのソリューションです。

speechEngineはランタイムに利用できるため、デベロッパは完全な制御のもと、リアルタイムでゲーム内テキストを音声に変換できます。UIナレーションや音声解説でアクセスしやすさを強化したい、マルチプレイヤーのやり取りに音声を追加したい、あるいはナラティブエクスペリエンス(物語性)を構築したい場合などに、デベロッパはspeechEngineを利用することでダイナミックで自然に聞こえる音声をゲームに追加できます。

オンデバイスの処理

speechEngineの強みはオンデバイスの処理にあります。CPUベースの計算フレームワークを利用することで、音声をデバイスでローカルに合成します。そのため、処理のいずれのステップにおいてもネットワーク接続が必要ありません。speechEngineは最適化された推論アルゴリズムと軽量なモデルを使用することで、CPUのシングルスレッドで音声を生成し、迅速なレスポンスタイムを実現します。また同テクノロジーはフットプリントも抑えられており、各ボイスエンジンに必要なメモリは10~15MB以下です。さらに各種プラットフォームでこのテクノロジーを利用できるため、クロスプラットフォーム展開が可能です。

 

オーサリングしてエクスポートし、ダイナミックに調整

Wwise向けのspeechEngineインテグレーションでは、ボイスコントロールパラメータがAuthoringインターフェースに直接追加されるため、ボイスのプロファイルやWwiseが提供する幅広いエフェクトを微調整し、ボイスのサウンドを細かくカスタマイズできます。 SoundBankにエクスポートすることで、ボイスエンジンをランタイムに制御できます。Wwise SDKからテキスト入力をプラグインに送信し、ボイスを再生すると、speechEngineが瞬時にテキストを読み上げます。またRTPCを使用してピッチやスピードなどを制御することも可能です。さらにきめ細かく制御するには、音声合成マークアップ言語(SSML)をテキスト入力として使用することで、より詳細にカスタマイズできます。

speechengine-voice-Wwise-plugin speechEngine-voice-Wwise-choose

音声合成マークアップ言語(SSML)

SSMLでテキストの読み方をさらにカスタマイズできます。シンプルなマークアップ言語の構文であるSSMLを使用し、音声の特定部分を強調するなど多数のエフェクトを適用できます。以下にいくつかの例をご紹介します。

例1:「Listen carefully!」

<emphasis level=”strong”>Listen carefully!</emphasis>

Kayla(ケイラ)
Molly(モリー)
Sophie(ソフィー)
 
 

 

 

 

 

例2:間を入れる

We are in dangerous territory <break time=”200ms”> proceed carefully from here on

Kayla(ケイラ)
Molly(モリー)
Sophie(ソフィー)
 
 

 

 

 

 

例3:テキストの解釈の仕方を変更する

<say-as interpret-as="characters">wasd</say-as>

Kayla(ケイラ)
Molly(モリー)
Sophie(ソフィー)
 
 

 

 

 

 

例4:単語を音素単位で規定する

Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>

Kayla(ケイラ)
Molly(モリー)
Sophie(ソフィー)
 
 

 

 

 

 

利用可能なすべてのSSMLについては公式のW3C仕様をご覧ください:https://www.w3.org/TR/speech-synthesis/#S3.2.3 

ボイスライブラリ

ReadSpeakerは40種類以上の言語に対応する115種類以上のボイスを含むライブラリにより、幅広いボイスオプションを提供します。 初回のspeechEngine for Wwiseプラグインリリースでは12種類の独特な音声のボイスを10種類の言語にてお届けします。また今後のリリースで言語やボイスの選択肢をさらに拡大していく予定です。

みなさまはspeechEngineをどう活用されますか?

ぜひspeechEngine for Wwiseをゲーム開発に活かしてください。当社とつながるには、Discordをご利用いただくか、メール(gaming@readspeaker.com)にてご連絡ください。 

 

ReadSpeakerは、倫理的なAI搭載音声ソリューションの提供に取り組んでいます。同社のゲーム業界における倫理的なAI音声へのアプローチについては、こちらをご覧ください(英文)。

ReadSpeaker

ReadSpeaker

ReadSpeakerは、数十の言語とリアルな音声を提供するグローバルな音声合成スペシャリストです。

ReadSpeakerのspeechEngine for Wwiseは、クロスプラットフォームのオンデバイステキスト読み上げ(TTS)ソリューションで、あらゆるテキスト入力から自然に聞こえる音声を生成します。

コメント

Replyを残す

メールアドレスが公開されることはありません。

ほかの記事

新しくなった、Wwise Authoring API

WwiseのオーディオエンジンのAPIは知っていると思いますが、オーサリングアプリケーションにもAPIがあれば、外部アプリケーションと「話せて」便利だと思いませんか? 実はWwise...

11.4.2017 - 作者 ベルナール・ロドリグ(Bernard Rodrigue)

Wwise Spatial Audio 2023.1 最新情報 | Reverb Zone

Reverb Zone入門 Wwise 2023.1ではWwise Spatial AudioにReverb Zoneという新しいツールが追加されました。Reverb...

10.1.2024 - 作者 トーマス・ハンセン

コーデックの選択ガイド

13.3.2024 - 作者 マチュー・ジャン(MATHIEU JEAN)

AudioLinkと共に挑む冒険

11.4.2024 - 作者 ピーター・ドレッシャー (PDX)

音楽をオフラインレンダリングするツール

音楽実装を効率よく...

8.6.2025 - 作者 田中 直人(NAOTO TANAKA)

Wwise 2025.1:最新情報 | ベータ版

Wwise 2025.1 ベータ版がリリースされ、Audiokinetic Launcherでインストールできるようになりました。...

9.7.2025 - 作者 Audiokinetic

ほかの記事

新しくなった、Wwise Authoring API

WwiseのオーディオエンジンのAPIは知っていると思いますが、オーサリングアプリケーションにもAPIがあれば、外部アプリケーションと「話せて」便利だと思いませんか? 実はWwise...

Wwise Spatial Audio 2023.1 最新情報 | Reverb Zone

Reverb Zone入門 Wwise 2023.1ではWwise Spatial AudioにReverb Zoneという新しいツールが追加されました。Reverb...

コーデックの選択ガイド