ReadSpeaker와 Audiokinetic이 함께 만든 speechEngine for Wwise를 소개합니다: 런타임 장치 내 텍스트 음성 변환(TTS)

Wwise에 대한 팁과 도구

Audiokinetic과 ReadSpeaker의 협력으로 speechEngine을 Wwise 파이프라인에 긴밀하게 통합하여, 개발자가 장치 내(On-Device) 텍스트 음성 변환(TTS)의 강력한 성능과 유연성을 게임에서 활용할 수 있도록 지원하게 되었습니다. speechEngine for Wwise은 크로스 플랫폼을 지원하는 텍스트 음성 변환(TTS) 솔루션으로 게임 개발 작업 과정에 완벽하게 통합됩니다.

speechEngine의 런타임 기능은 개발자에게 완벽한 제어권을 제공하여 실시간으로 게임 내 텍스트를 음성으로 변환할 수 있습니다. UI 나레이션과 오디오 설명을 통해 접근성을 강화하거나, 멀티플레이어 상호작용에 음성을 추가하거나, 내러티브 경험을 구축하는 등 어떤 용도로든 speechEngine은 개발자가 게임에 동적이고 자연스러운 음성을 손쉽게 구현할 수 있도록 지원합니다.

장치 내 처리

speechEngine의 가장 큰 장점은 장치 내에서 바로 사용할 수 있다는 점입니다. CPU 기반 컴퓨팅 프레임워크를 사용하여 장치에서 직접 음성을 합성할 수 있습니다. 즉, 프로세스의 어느 단계에서도 네트워크 연결이 필요하지 않습니다. speechEngine은 최적화된 추론 알고리즘과 경량 모델을 활용하여 CPU의 단일 스레드에서 빠른 응답 속도로 음성을 생성합니다. 동시에 각 음성 엔진이 약 10~15MB의 메모리만으로 동작하도록 최적화되어 있습니다. 더불어 이 기술을 다양한 플랫폼에서 사용할 수 있도록 지원하여 크로스 플랫폼 배포가 가능합니다.

저작하기, 내보내기, 동적으로 조정하기

speechEngine의 Wwise 통합은 저작 인터페이스에 음성 제어 매개변수를 직접 추가하여, Wwise가 제공하는 다양한 효과와 함께 음성 프로필을 세밀하게 조정하여 음성 사운드를 더욱 정밀하게 커스터마이징할 수 있도록 지원합니다. SoundBank로 내보낼 때, 런타임에서 음성 엔진을 직접 제어할 수 있습니다. Wwise SDK를 통해 플러그인에 텍스트 입력을 전달하고 음성을 재생하면, speechEngine이 즉시 해당 텍스트를 음성으로 변환합니다. 뿐만 아니라, RTPC를 통해 음성의 피치, 속도 등 다양한 특성을 제어 할 수 있습니다. 보다 정밀한 음성 제어가 필요한 경우 음성 합성 마크업 언어(Speech Synthesis Markup Language, SSML)를 텍스트 입력으로 활용하여 세밀하게 커스터마이징할 수 있습니다.

speechengine-voice-Wwise-plugin speechEngine-voice-Wwise-choose

음성 합성 마크업 언어 (SSML)

SSML을 활용하면 텍스트의 음성 변환 방식을 추가로 커스터마이징할 수 있습니다. SSML의 간단한 마크업 언어 구문을 활용하면 다음의 예제와 같이 특정 구간 강조와 같은 다양한 음성 효과를 구현할 수 있습니다.

예제 1: "Listen carefully!"

<emphasis level=”strong”>Listen carefully!</emphasis>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 2: 중단 삽입하기

We are in dangerous territory <break time=”200ms”> proceed carefully from here on

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 3: 텍스트 해석 방식 변경하기

<say-as interpret-as="characters">wasd</say-as>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 4: 음소 단위로 단어 철자 표기하기:

Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

SSML 전체 기능에 대한 자세한 내용은 공식 W3C 사양을 참조하세요: https://www.w3.org/TR/speech-synthesis/#S3.2.3 

음성 라이브러리

ReadSpeaker는 40개 이상의 언어, 115개 이상의 음성 옵션을 갖춘 광범위한 음성 라이브러리를 제공합니다. 초기 speechEngine for Wwise 플러그인 출시 버전에는 10개 언어로 구성된 12개의 고유한 음성이 포함되어 있습니다. 향후 업데이트를 통해 지원 언어 및 음성 옵션을 지속적으로 확대할 계획입니다.

speechEngine으로 무엇을 만들까요?

게임을 개발하는 분들이 직접 speechEngine for Wwise의 강력한 기능을 경험해볼 수 있기를 기대합니다. Discord에서 소통하거나 이메일(gaming@readspeaker.com)로 문의해주세요. 

ReadSpeaker는 윤리적인 AI 기반 음성 솔루션을 제공하기 위해 최선을 다하고 있습니다. 게임의 윤리적 AI 음성과 관련한 방침에 대한 자세한 내용은 여기를 참조하세요.

ReadSpeaker

ReadSpeaker

ReadSpeaker는 자연스러운 다국어 음성 합성 기술을 제공하는 글로벌 음성 전문 기업입니다.

ReadSpeaker의 'speechEngine for Wwise'는 크로스 플랫폼을 지원하는 장치 내 텍스트 음성 변환(TTS, Text to Speech) 솔루션으로, 입력된 텍스트를 자연스러운 음성으로 변환할 수 있도록 지원합니다.

댓글

댓글 달기

이메일 주소는 공개되지 않습니다.


다른 글

Wwise Spatial Audio 2023.1의 새로운 기능 | 개선된 Aux Send Model

Wwise 2023.1에서 새로 제공되는 수많은 기능의 목록을 살펴보셨다면 아마 '개선된 Aux Send Model'이라는 흥미로운 문구를 발견하셨을 겁니다. 도대체 이게 무슨...

14.12.2023 - 작성자: Nathan Harris

올바른 코덱 선택에 대한 안내

게임 오디오에서는 항상 오디오 파일을 압축해야 했습니다. 우리가 꿈꾸는 그대로의 오디오 환경을 모두 압축되지 않은 오디오 샘플로 두기에는 여전히 디스크 공간이나 메모리가 부족하다는...

14.5.2024 - 작성자: 마튜 장 (Mathieu Jean)

AudioLink로 떠나는 여행

지난 10월 게임사운드콘(GameSoundCon)에서 저는 호텔 근처 고급 샌드위치 가게에서 데미안(Damian)과 점심을 먹고 있었습니다. 예상하셨겠지만 저희는 오디오 기술에...

10.6.2024 - 작성자: 피터 "pdx" 드레셔 (Peter "pdx" Drescher)

Unreal Engine에서 Wwise 사운드를 재생하는 방법

Wwise에는 수많은 기능이 있습니다. 하지만 개발 초기에는 사용법에 대한 충분한 정보가 없을 경우 제대로 작동하지 않을 수 있죠. 저는 초기의 몇 가지 삐걱거림 때문에...

30.7.2024 - 작성자: 히로시 고다 (Hiroshi Goda)

팀에서 WAAPI와 Python을 사용한 작업 및 예시

이 글에서는 제가 오랫동안 사용해온 WAAPI 작업에 대한 다소 주관적인 접근 방식을 설명해드리려고 합니다. 이 접근 방식은 Python, 명령어 애드온(add-on), 그리고...

4.12.2024 - 작성자: 유진 체르니 (Eugene Cherny)

Wwise HDR: 게임 믹싱을 위한 개요와 모범 사례

소개 HDR(High Dynamic Range)는 Wwise의 기능 중 하나로, 프로젝트의 출력 다이내믹 레인지를 믹싱하고 관리하도록 도와주는 매우 강력한 도구입니다. 운이 좋게도...

17.4.2025 - 작성자: 알렉스 프레비티 (Alex Previty)

다른 글

Wwise Spatial Audio 2023.1의 새로운 기능 | 개선된 Aux Send Model

Wwise 2023.1에서 새로 제공되는 수많은 기능의 목록을 살펴보셨다면 아마 '개선된 Aux Send Model'이라는 흥미로운 문구를 발견하셨을 겁니다. 도대체 이게 무슨...

올바른 코덱 선택에 대한 안내

게임 오디오에서는 항상 오디오 파일을 압축해야 했습니다. 우리가 꿈꾸는 그대로의 오디오 환경을 모두 압축되지 않은 오디오 샘플로 두기에는 여전히 디스크 공간이나 메모리가 부족하다는...

AudioLink로 떠나는 여행

지난 10월 게임사운드콘(GameSoundCon)에서 저는 호텔 근처 고급 샌드위치 가게에서 데미안(Damian)과 점심을 먹고 있었습니다. 예상하셨겠지만 저희는 오디오 기술에...