ReadSpeaker et Audiokinetic présentent speechEngine pour Wwise : la synthèse vocale embarquée en temps réel

Outils et conseils pour Wwise

Audiokinetic et ReadSpeaker sont fiers d'intégrer speechEngine de manière approfondie dans le pipeline Wwise, offrant ainsi aux développeurs la possibilité d'exploiter toute la puissance et la flexibilité de la synthèse vocale embarquée dans leur jeu. speechEngine pour Wwise est une solution multiplateforme qui s'intègre parfaitement au flux de travail du développement de jeux vidéo. 

Les capacités en temps réel de speechEngine offrent aux développeurs un contrôle total, leur permettant de convertir dynamiquement le texte du jeu en dialogues. Qu'il s'agisse d'améliorer l'accessibilité avec la narration d'interface utilisateur et l'audiodescription, d'ajouter des voix aux interactions multijoueurs ou de créer des expériences narratives immersives, speechEngine permet d'intégrer une voix naturelle et dynamique à votre jeu.

Traitement audio embarqué

Le principal atout de speechEngine réside dans ses capacités embarquées. Grâce à une architecture optimisée reposant sur le processeur, nous pouvons générer la parole directement sur l'appareil. De fait, une connexion réseau n'est nécessaire à aucun moment du processus. En s'appuyant sur des algorithmes optimisés pour l'inférence ainsi que sur des modèles légers, speechEngine synthétise la parole sur un seul thread du processeur, garantissant ainsi des temps de réponse rapides. Dans le même temps, nous avons optimisé l'empreinte mémoire de notre technologie pour que chaque moteur vocal requière environ 10 à 15 Mo de mémoire. De plus, notre solution est disponible sur toutes les plateformes, permettant ainsi un déploiement multiplateforme fluide.

Création, exportation et ajustements dynamiques

L'intégration de speechEngine pour Wwise ajoute des paramètres de contrôle directement dans l'interface de création, permettant d'ajuster le profil vocal et d'accéder à une large gamme d'effets proposés par Wwise pour personnaliser davantage le rendu vocal. Lors de l'exportation vers une SoundBank, vous gardez le contrôle du moteur vocal au moment de l'exécution. En envoyant du texte au plugiciel via le SDK de Wwise et en déclenchant la lecture vocale, speechEngine lit immédiatement le texte à voix haute. De plus, des contrôles pour la hauteur (pitch), la vitesse et d'autres paramètres sont accessibles via les RTPC. Pour un réglage encore plus précis, le Speech Synthesis Markup Language (Langage de balisage de synthèse vocale, ou SSML) peut être utilisé comme entrée textuelle afin d'affiner davantage la personnalisation.

speechengine-voice-Wwise-plugin speechEngine-voice-Wwise-choose

Speech Synthesis Markup Language (SSML)

Le langage SSML vous permet de personnaliser encore davantage la lecture du texte. Grâce à sa syntaxe simple, il offre une multitude d'effets, comme l'accentuation de certaines parties du texte. Voici quelques exemples d'utilisation :

Exemple 1 : « Listen carefully! »

<emphasis level=« strong »>Listen carefully!</emphasis>

Kayla
Molly
Sophie
 
 

 

 

 

 

Exemple 2 : Insérer des pauses

We are in dangerous territory <break time=”200ms”> proceed carefully from here on

Kayla
Molly
Sophie
 
 

 

 

 

 

Exemple 3 : Modifier l'interprétation du texte

<say-as interpret-as="characters">wasd</say-as>

Kayla
Molly
Sophie
 
 

 

 

 

 

Exemple 4 : épeler les mots phonème par phonème :

Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>

Kayla
Molly
Sophie
 
 

 

 

 

 

Pour plus de détails sur l'ensemble des possibilités du langage SSML, voir la documentation officielle de W3C : https://www.w3.org/TR/speech-synthesis/#S3.2.3 

Bibliothèque vocale

ReadSpeaker propose une large sélection de voix, avec une bibliothèque de plus de 115 voix couvrant plus de 40 langues. La version initiale du plugiciel speechEngine pour Wwise inclut 12 voix distinctes disponibles dans 10 langues différentes. Nous prévoyons d'élargir cette sélection de langues et de voix dans les prochaines versions.

Qu'allez-vous créer avec speechEngine ?

Nous invitons les développeurs de jeux à découvrir tout le potentiel de speechEngine pour Wwise. Rejoignez-nous sur Discord ou contactez-nous par courrier électronique à l'adresse suivante : gaming@readspeaker.com

ReadSpeaker s'engage à fournir des solutions vocales utilisant l'IA tout en garantissant une approche éthique. Pour en savoir plus sur cette approche de l'IA vocale éthique dans les jeux vidéo, cliquez ici.

ReadSpeaker

ReadSpeaker

ReadSpeaker est un spécialiste mondial de la voix, offrant des dizaines de langues et des voix réalistes.

speechEngine pour Wwise de ReadSpeaker est une solution de synthèse vocale multiplateforme et embarquée qui permet de créer une parole naturelle à partir de n'importe quel texte.

Commentaires

Laisser une réponse

Votre adresse électronique ne sera pas publiée.


Plus d'articles

Créer avec des Objets Audio dans Wwise

L'avenir : toujours lointain, jamais à portée de main ; et pourtant, nous semblons toujours courir...

21.4.2022 - Par Damian Kastbauer

Présentation du Wwise Authoring Query Language

« Wwise est un gros tableur ». C'est une phrase que nous entendons souvent en tant que membres de...

28.4.2022 - Par Bernard Rodrigue

Impacter et Unreal Engine | Comment contrôler le plugiciel Impacter en utilisant la physique du moteur de jeu

Introduction Impacter est un nouveau prototype de plugiciel de modélisation de sons d'impacts pour...

10.11.2022 - Par Sean Soraghan

Comment créer automatiquement des ressources VO temporaires à l'aide de WAAPI et TTS

Introduction L'automatisation est une approche couramment utilisée sur de grands projets.Dans une...

11.5.2023 - Par Huang Chao

Nouveauté de Wwise Spatial Audio 2023.1 | Zones de réverbération

Introduction aux Zones de réverbération Wwise 23.1 introduit une nouvelle fonctionnalité à Wwise...

9.5.2025 - Par Thomas Hansen

24 conseils et astuces tirés des formations Wwise

Les formations Wwise ont débuté en 2020 et, en quelques années seulement, elles sont devenues une...

1.10.2025 - Par Mads Maretty Sønderup

Plus d'articles

Créer avec des Objets Audio dans Wwise

L'avenir : toujours lointain, jamais à portée de main ; et pourtant, nous semblons toujours courir...

Présentation du Wwise Authoring Query Language

« Wwise est un gros tableur ». C'est une phrase que nous entendons souvent en tant que membres de...

Impacter et Unreal Engine | Comment contrôler le plugiciel Impacter en utilisant la physique du moteur de jeu

Introduction Impacter est un nouveau prototype de plugiciel de modélisation de sons d'impacts pour...