Audiokinetic과 ReadSpeaker의 협력으로 speechEngine을 Wwise 파이프라인에 긴밀하게 통합하여, 개발자가 장치 내(On-Device) 텍스트 음성 변환(TTS)의 강력한 성능과 유연성을 게임에서 활용할 수 있도록 지원하게 되었습니다. speechEngine for Wwise은 크로스 플랫폼을 지원하는 텍스트 음성 변환(TTS) 솔루션으로 게임 개발 작업 과정에 완벽하게 통합됩니다.
speechEngine의 런타임 기능은 개발자에게 완벽한 제어권을 제공하여 실시간으로 게임 내 텍스트를 음성으로 변환할 수 있습니다. UI 나레이션과 오디오 설명을 통해 접근성을 강화하거나, 멀티플레이어 상호작용에 음성을 추가하거나, 내러티브 경험을 구축하는 등 어떤 용도로든 speechEngine은 개발자가 게임에 동적이고 자연스러운 음성을 손쉽게 구현할 수 있도록 지원합니다.
장치 내 처리
speechEngine의 가장 큰 장점은 장치 내에서 바로 사용할 수 있다는 점입니다. CPU 기반 컴퓨팅 프레임워크를 사용하여 장치에서 직접 음성을 합성할 수 있습니다. 즉, 프로세스의 어느 단계에서도 네트워크 연결이 필요하지 않습니다. speechEngine은 최적화된 추론 알고리즘과 경량 모델을 활용하여 CPU의 단일 스레드에서 빠른 응답 속도로 음성을 생성합니다. 동시에 각 음성 엔진이 약 10~15MB의 메모리만으로 동작하도록 최적화되어 있습니다. 더불어 이 기술을 다양한 플랫폼에서 사용할 수 있도록 지원하여 크로스 플랫폼 배포가 가능합니다.
저작하기, 내보내기, 동적으로 조정하기
speechEngine의 Wwise 통합은 저작 인터페이스에 음성 제어 매개변수를 직접 추가하여, Wwise가 제공하는 다양한 효과와 함께 음성 프로필을 세밀하게 조정하여 음성 사운드를 더욱 정밀하게 커스터마이징할 수 있도록 지원합니다. SoundBank로 내보낼 때, 런타임에서 음성 엔진을 직접 제어할 수 있습니다. Wwise SDK를 통해 플러그인에 텍스트 입력을 전달하고 음성을 재생하면, speechEngine이 즉시 해당 텍스트를 음성으로 변환합니다. 뿐만 아니라, RTPC를 통해 음성의 피치, 속도 등 다양한 특성을 제어 할 수 있습니다. 보다 정밀한 음성 제어가 필요한 경우 음성 합성 마크업 언어(Speech Synthesis Markup Language, SSML)를 텍스트 입력으로 활용하여 세밀하게 커스터마이징할 수 있습니다.
음성 합성 마크업 언어 (SSML)
SSML을 활용하면 텍스트의 음성 변환 방식을 추가로 커스터마이징할 수 있습니다. SSML의 간단한 마크업 언어 구문을 활용하면 다음의 예제와 같이 특정 구간 강조와 같은 다양한 음성 효과를 구현할 수 있습니다.
예제 1: "Listen carefully!"
<emphasis level=”strong”>Listen carefully!</emphasis>
카일라 (Kayla)몰리 (Molly)소피 (Sophie) |
|
예제 2: 중단 삽입하기
We are in dangerous territory <break time=”200ms”> proceed carefully from here on
카일라 (Kayla)몰리 (Molly)소피 (Sophie) |
|
예제 3: 텍스트 해석 방식 변경하기
<say-as interpret-as="characters">wasd</say-as>
카일라 (Kayla)몰리 (Molly)소피 (Sophie) |
|
예제 4: 음소 단위로 단어 철자 표기하기:
Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>
카일라 (Kayla)몰리 (Molly)소피 (Sophie) |
|
SSML 전체 기능에 대한 자세한 내용은 공식 W3C 사양을 참조하세요: https://www.w3.org/TR/speech-synthesis/#S3.2.3
음성 라이브러리
ReadSpeaker는 40개 이상의 언어, 115개 이상의 음성 옵션을 갖춘 광범위한 음성 라이브러리를 제공합니다. 초기 speechEngine for Wwise 플러그인 출시 버전에는 10개 언어로 구성된 12개의 고유한 음성이 포함되어 있습니다. 향후 업데이트를 통해 지원 언어 및 음성 옵션을 지속적으로 확대할 계획입니다.
speechEngine으로 무엇을 만들까요?
게임을 개발하는 분들이 직접 speechEngine for Wwise의 강력한 기능을 경험해볼 수 있기를 기대합니다. Discord에서 소통하거나 이메일(gaming@readspeaker.com)로 문의해주세요.
ReadSpeaker는 윤리적인 AI 기반 음성 솔루션을 제공하기 위해 최선을 다하고 있습니다. 게임의 윤리적 AI 음성과 관련한 방침에 대한 자세한 내용은 여기를 참조하세요.



댓글