ReadSpeaker 和 Audiokinetic 联手推出「speechEngine for Wwise」运行时设备端文本转语音解决方案

Wwise 技巧和工具

Audiokinetic 和 ReadSpeaker 很高兴能将 speechEngine 深度集成到 Wwise 管线中,以便开发者在游戏中充分运用高效且灵活的设备端文本转语音功能。作为跨平台解决方案,speechEngine for Wwise 可无缝集成到游戏开发工作流程中。

借助 speechEngine 的运行时处理能力,开发者可完全控制所生成的语音,实现游戏内文本到语音的实时转换。无论是想通过 UI 旁白和音频描述增强无障碍性,还是为多人互动添加语音抑或是构建叙事体验,speechEngine 都能帮助开发者在游戏中添加动态生成且毫无违和感的语音。

 

设备端处理

speechEngine 的优势在于其设备端处理能力。借助基于 CPU 的计算框架,我们可以在设备本地合成语音。也就是说,在整个处理过程中都不需要连接网络。利用优化的推理算法和轻量级模型,speechEngine 可在单个 CPU 线程中快速生成语音。同时,我们的解决方案占用空间很小,每个语音引擎只需约 10-15 MB 内存。而且,在各种平台上都可以使用,非常方便进行跨平台部署。

设置、导出和动态调整

通过为 Wwise 开发的 speechEngine 集成包,可直接将语音控制参数添加到设计工具界面来对语音特征实施微调,并利用 Wwise 提供的各种效果器进一步根据需要对语音进行自定义。在导出到 SoundBank 时,可在运行时控制语音引擎。只需通过 Wwise SDK 向插件发送文本输入并播放语音,speechEngine 就会立即诵读文本。另外,还可利用 RTPC 对音高、语速等进行控制。若要实现更加精细的控制,可将语音合成标记语言 (SSML) 用作文本输入来做进一步的自定义。

speechengine-voice-Wwise-plugin speechEngine-voice-Wwise-choose

语音合成标记语言 (SSML)

SSML 允许进一步根据需要自定义文本的诵读方式。利用 SSML 的简单标记语言语法,可实现各种效果(比如强调语音的某个部分)。就像下面的例子一样:

示例 1:"Listen carefully!"

<emphasis level=”strong”>Listen carefully!</emphasis>

Kayla
Molly
Sophie
 
 

 

 

 

 

示例 2:插入停顿

We are in dangerous territory <break time=”200ms”> proceed carefully from here on

Kayla
Molly
Sophie
 
 

 

 

 

 

示例 3:改变对文本的解读方式

<say-as interpret-as="characters">wasd</say-as>

Kayla
Molly
Sophie
 
 

 

 

 

 

示例 4:按照音素拼读单词

Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>

Kayla
Molly
Sophie
 
 

 

 

 

 

有关 SSML 的详细信息,请参阅 W3C 官方规范:https://www.w3.org/TR/speech-synthesis/#S3.2.3 

语音库

ReadSpeaker 提供各种语音选择,语音库中有 40 多种语言的超过 115 种语音。初始版本的 speechEngine for Wwise 插件支持 10 种语言和 12 种语音。在未来版本中,会提供对更多语言和语音的支持。

您打算用 speechEngine 做什么?

欢迎广大游戏开发者探索 speechEngine for Wwise 的强大功能。必要时,不妨通过 Discord 与我们联系,或者给我们发送电子邮件 (gaming@readspeaker.com)。 

ReadSpeaker 致力于提供符合伦理的人工智能语音解决方案。点击此处了解他们在游戏领域中实现伦理 AI 语音的方法。

ReadSpeaker

ReadSpeaker

ReadSpeaker 是全球领先的语音服务提供商,能提供数十种语言的逼真语音。

ReadSpeaker 的 speechEngine for Wwise 是个跨平台的设备端文本转语音解决方案,其可通过文本输入生成毫无违和感的语音。

评论

留下回复

您的电子邮件地址将不会被公布。


更多文章

利用命令扩展改进工作流程

持续改进工作流程 ...

1.4.2019 - 作者:伯纳德 罗德里格 (Bernard Rodrigue)

十条你得知道的 Wwise Launcher 用法(2019 版)

注:本文基于 2018 年初在 Audiokinetic 公众号上发表的文章《十一条你可能不知道的 Wwise Launcher 用法》,由作者针对软件更新做了改动,不影响操作的截图沿用旧版本。...

15.7.2019 - 作者:李北南

Wwise 2021.1 新增功能 | Beta 版本

基于对象的音频管线 Wwise 2021.1 允许根据平台特性灵活地渲染声音,以最大限度地提高终端输出配置的空间定位精度。为便于针对支持 Audio Object 的平台单独保留 Audio...

4.2.2021 - 作者:Audiokinetic (音频动能)

Wwise Spatial Audio 2023.1 新增功能 | Reverb Zone

Reverb Zone 简介 在 Wwise 23.1 中,我们为 Wwise Spatial Audio 增添了一个名为 Reverb Zone 的工具。Reverb Zone 本质上来说是...

10.1.2024 - 作者:托马斯•汉森 (Thomas Hansen)

Wwise 新手经常遇到的 10 个问题

12.10.2024 - 作者:麦斯·麦雷蒂·桑德鲁普 (Mads Maretty Sønderup)

离线音乐渲染工具:高效检查音频循环和过渡

高效地整合音乐 在使用 Wwise...

23.7.2025 - 作者:田中 直人(NAOTO TANAKA)

更多文章

利用命令扩展改进工作流程

持续改进工作流程 ...

十条你得知道的 Wwise Launcher 用法(2019 版)

注:本文基于 2018 年初在 Audiokinetic 公众号上发表的文章《十一条你可能不知道的 Wwise Launcher 用法》,由作者针对软件更新做了改动,不影响操作的截图沿用旧版本。...

Wwise 2021.1 新增功能 | Beta 版本

基于对象的音频管线 Wwise 2021.1 允许根据平台特性灵活地渲染声音,以最大限度地提高终端输出配置的空间定位精度。为便于针对支持 Audio Object 的平台单独保留 Audio...