ReadSpeaker와 Audiokinetic이 함께 만든 speechEngine for Wwise를 소개합니다: 런타임 장치 내 텍스트 음성 변환(TTS)

Wwise에 대한 팁과 도구

Audiokinetic과 ReadSpeaker의 협력으로 speechEngine을 Wwise 파이프라인에 긴밀하게 통합하여, 개발자가 장치 내(On-Device) 텍스트 음성 변환(TTS)의 강력한 성능과 유연성을 게임에서 활용할 수 있도록 지원하게 되었습니다. speechEngine for Wwise은 크로스 플랫폼을 지원하는 텍스트 음성 변환(TTS) 솔루션으로 게임 개발 작업 과정에 완벽하게 통합됩니다.

speechEngine의 런타임 기능은 개발자에게 완벽한 제어권을 제공하여 실시간으로 게임 내 텍스트를 음성으로 변환할 수 있습니다. UI 나레이션과 오디오 설명을 통해 접근성을 강화하거나, 멀티플레이어 상호작용에 음성을 추가하거나, 내러티브 경험을 구축하는 등 어떤 용도로든 speechEngine은 개발자가 게임에 동적이고 자연스러운 음성을 손쉽게 구현할 수 있도록 지원합니다.

장치 내 처리

speechEngine의 가장 큰 장점은 장치 내에서 바로 사용할 수 있다는 점입니다. CPU 기반 컴퓨팅 프레임워크를 사용하여 장치에서 직접 음성을 합성할 수 있습니다. 즉, 프로세스의 어느 단계에서도 네트워크 연결이 필요하지 않습니다. speechEngine은 최적화된 추론 알고리즘과 경량 모델을 활용하여 CPU의 단일 스레드에서 빠른 응답 속도로 음성을 생성합니다. 동시에 각 음성 엔진이 약 10~15MB의 메모리만으로 동작하도록 최적화되어 있습니다. 더불어 이 기술을 다양한 플랫폼에서 사용할 수 있도록 지원하여 크로스 플랫폼 배포가 가능합니다.

저작하기, 내보내기, 동적으로 조정하기

speechEngine의 Wwise 통합은 저작 인터페이스에 음성 제어 매개변수를 직접 추가하여, Wwise가 제공하는 다양한 효과와 함께 음성 프로필을 세밀하게 조정하여 음성 사운드를 더욱 정밀하게 커스터마이징할 수 있도록 지원합니다. SoundBank로 내보낼 때, 런타임에서 음성 엔진을 직접 제어할 수 있습니다. Wwise SDK를 통해 플러그인에 텍스트 입력을 전달하고 음성을 재생하면, speechEngine이 즉시 해당 텍스트를 음성으로 변환합니다. 뿐만 아니라, RTPC를 통해 음성의 피치, 속도 등 다양한 특성을 제어 할 수 있습니다. 보다 정밀한 음성 제어가 필요한 경우 음성 합성 마크업 언어(Speech Synthesis Markup Language, SSML)를 텍스트 입력으로 활용하여 세밀하게 커스터마이징할 수 있습니다.

speechengine-voice-Wwise-plugin speechEngine-voice-Wwise-choose

음성 합성 마크업 언어 (SSML)

SSML을 활용하면 텍스트의 음성 변환 방식을 추가로 커스터마이징할 수 있습니다. SSML의 간단한 마크업 언어 구문을 활용하면 다음의 예제와 같이 특정 구간 강조와 같은 다양한 음성 효과를 구현할 수 있습니다.

예제 1: "Listen carefully!"

<emphasis level=”strong”>Listen carefully!</emphasis>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 2: 중단 삽입하기

We are in dangerous territory <break time=”200ms”> proceed carefully from here on

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 3: 텍스트 해석 방식 변경하기

<say-as interpret-as="characters">wasd</say-as>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

예제 4: 음소 단위로 단어 철자 표기하기:

Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>

카일라 (Kayla)
몰리 (Molly)
소피 (Sophie)
 
 

 

 

 

 

SSML 전체 기능에 대한 자세한 내용은 공식 W3C 사양을 참조하세요: https://www.w3.org/TR/speech-synthesis/#S3.2.3 

음성 라이브러리

ReadSpeaker는 40개 이상의 언어, 115개 이상의 음성 옵션을 갖춘 광범위한 음성 라이브러리를 제공합니다. 초기 speechEngine for Wwise 플러그인 출시 버전에는 10개 언어로 구성된 12개의 고유한 음성이 포함되어 있습니다. 향후 업데이트를 통해 지원 언어 및 음성 옵션을 지속적으로 확대할 계획입니다.

speechEngine으로 무엇을 만들까요?

게임을 개발하는 분들이 직접 speechEngine for Wwise의 강력한 기능을 경험해볼 수 있기를 기대합니다. Discord에서 소통하거나 이메일(gaming@readspeaker.com)로 문의해주세요. 

ReadSpeaker는 윤리적인 AI 기반 음성 솔루션을 제공하기 위해 최선을 다하고 있습니다. 게임의 윤리적 AI 음성과 관련한 방침에 대한 자세한 내용은 여기를 참조하세요.

ReadSpeaker

ReadSpeaker

ReadSpeaker는 자연스러운 다국어 음성 합성 기술을 제공하는 글로벌 음성 전문 기업입니다.

ReadSpeaker의 'speechEngine for Wwise'는 크로스 플랫폼을 지원하는 장치 내 텍스트 음성 변환(TTS, Text to Speech) 솔루션으로, 입력된 텍스트를 자연스러운 음성으로 변환할 수 있도록 지원합니다.

댓글

댓글 달기

이메일 주소는 공개되지 않습니다.

다른 글

Impacter와 Unreal - 게임 물리를 사용하여 Impacter 플러그인 제어하기

소개 Impacter(임팩터)는 Wwise를 위한 새로운 타격음 모델링 플러그인입니다. 플러그인 소개는 이 글을 통해 확인해주세요. 이 글에서는 Impacter를 사용하여...

3.6.2021 - 작성자: 션 소라한 (Sean Soraghan)

Wwise에서 Audio Object를 저작하고 프로파일링하는 간단한 9 단계

Wwise에서 새롭게 제공되는 오브젝트 기반 오디오 파이프라인을 둘러보고 싶지만 어디서부터 시작해야 할지 모르시는 분들 계시나요? 그렇다면 Windows용 Wwise에서 Audio...

21.7.2021 - 작성자: 데미안 캐스트바우어 (Damian Kastbauer)

ReaWwise 개발 | 제 2부 - 구현

이 글은 2부작으로 제작된 블로그 시리즈의 제 2부입니다. 제 1부에서는 ReaWwise의 사전 제작에 대해 알아보았고, 제 2부에서는 이 확장의 개발에 대해 알아보게 됩니다.거의...

3.11.2022 - 작성자: 앤드류 코스타 (Andrew Costa)

WAQL 2.0

Wwise Authoring Query Language (WAQL, 와클) 첫 번째 버전이 출시된 지 벌써 몇 년이 지났습니다. 첫 버전 이후 크게 변경된 점은 없습니다. 가장...

10.8.2023 - 작성자: 베르나르 로드리그 (Bernard Rodrigue)

Wwise 출시 주기 변경 | Sim-Patch 출시 및 언리얼 엔진 프리뷰 개발 지원

이 글에서는 지난 몇 달 동안 Audiokinetic의 개발 프로세스에 적용된 몇몇 변경 사항을 공유하려고 합니다. 이러한 변경 사항은 Wwise가 더 자주 제공되어 더 빨리 다음...

28.5.2024 - 작성자: 기욤 르노 (Guillaume Renaud)

Unreal Engine에서 Wwise 사운드를 재생하는 방법

Wwise에는 수많은 기능이 있습니다. 하지만 개발 초기에는 사용법에 대한 충분한 정보가 없을 경우 제대로 작동하지 않을 수 있죠. 저는 초기의 몇 가지 삐걱거림 때문에...

30.7.2024 - 작성자: 히로시 고다 (Hiroshi Goda)

다른 글

Impacter와 Unreal - 게임 물리를 사용하여 Impacter 플러그인 제어하기

소개 Impacter(임팩터)는 Wwise를 위한 새로운 타격음 모델링 플러그인입니다. 플러그인 소개는 이 글을 통해 확인해주세요. 이 글에서는 Impacter를 사용하여...

Wwise에서 Audio Object를 저작하고 프로파일링하는 간단한 9 단계

Wwise에서 새롭게 제공되는 오브젝트 기반 오디오 파이프라인을 둘러보고 싶지만 어디서부터 시작해야 할지 모르시는 분들 계시나요? 그렇다면 Windows용 Wwise에서 Audio...

ReaWwise 개발 | 제 2부 - 구현

이 글은 2부작으로 제작된 블로그 시리즈의 제 2부입니다. 제 1부에서는 ReaWwise의 사전 제작에 대해 알아보았고, 제 2부에서는 이 확장의 개발에 대해 알아보게 됩니다.거의...