Audiokinetic et ReadSpeaker sont fiers d'intégrer speechEngine de manière approfondie dans le pipeline Wwise, offrant ainsi aux développeurs la possibilité d'exploiter toute la puissance et la flexibilité de la synthèse vocale embarquée dans leur jeu. speechEngine pour Wwise est une solution multiplateforme qui s'intègre parfaitement au flux de travail du développement de jeux vidéo.
Les capacités en temps réel de speechEngine offrent aux développeurs un contrôle total, leur permettant de convertir dynamiquement le texte du jeu en dialogues. Qu'il s'agisse d'améliorer l'accessibilité avec la narration d'interface utilisateur et l'audiodescription, d'ajouter des voix aux interactions multijoueurs ou de créer des expériences narratives immersives, speechEngine permet d'intégrer une voix naturelle et dynamique à votre jeu.
Traitement audio embarqué
Le principal atout de speechEngine réside dans ses capacités embarquées. Grâce à une architecture optimisée reposant sur le processeur, nous pouvons générer la parole directement sur l'appareil. De fait, une connexion réseau n'est nécessaire à aucun moment du processus. En s'appuyant sur des algorithmes optimisés pour l'inférence ainsi que sur des modèles légers, speechEngine synthétise la parole sur un seul thread du processeur, garantissant ainsi des temps de réponse rapides. Dans le même temps, nous avons optimisé l'empreinte mémoire de notre technologie pour que chaque moteur vocal requière environ 10 à 15 Mo de mémoire. De plus, notre solution est disponible sur toutes les plateformes, permettant ainsi un déploiement multiplateforme fluide.
Création, exportation et ajustements dynamiques
L'intégration de speechEngine pour Wwise ajoute des paramètres de contrôle directement dans l'interface de création, permettant d'ajuster le profil vocal et d'accéder à une large gamme d'effets proposés par Wwise pour personnaliser davantage le rendu vocal. Lors de l'exportation vers une SoundBank, vous gardez le contrôle du moteur vocal au moment de l'exécution. En envoyant du texte au plugiciel via le SDK de Wwise et en déclenchant la lecture vocale, speechEngine lit immédiatement le texte à voix haute. De plus, des contrôles pour la hauteur (pitch), la vitesse et d'autres paramètres sont accessibles via les RTPC. Pour un réglage encore plus précis, le Speech Synthesis Markup Language (Langage de balisage de synthèse vocale, ou SSML) peut être utilisé comme entrée textuelle afin d'affiner davantage la personnalisation.
Speech Synthesis Markup Language (SSML)
Le langage SSML vous permet de personnaliser encore davantage la lecture du texte. Grâce à sa syntaxe simple, il offre une multitude d'effets, comme l'accentuation de certaines parties du texte. Voici quelques exemples d'utilisation :
Exemple 1 : « Listen carefully! »
<emphasis level=« strong »>Listen carefully!</emphasis>
KaylaMollySophie |
|
Exemple 2 : Insérer des pauses
We are in dangerous territory <break time=”200ms”> proceed carefully from here on
KaylaMollySophie |
|
Exemple 3 : Modifier l'interprétation du texte
<say-as interpret-as="characters">wasd</say-as>
KaylaMollySophie |
|
Exemple 4 : épeler les mots phonème par phonème :
Hello <phoneme alphabet="ipa" ph="wɜːld">world</phoneme>
KaylaMollySophie |
|
Pour plus de détails sur l'ensemble des possibilités du langage SSML, voir la documentation officielle de W3C : https://www.w3.org/TR/speech-synthesis/#S3.2.3
Bibliothèque vocale
ReadSpeaker propose une large sélection de voix, avec une bibliothèque de plus de 115 voix couvrant plus de 40 langues. La version initiale du plugiciel speechEngine pour Wwise inclut 12 voix distinctes disponibles dans 10 langues différentes. Nous prévoyons d'élargir cette sélection de langues et de voix dans les prochaines versions.
Qu'allez-vous créer avec speechEngine ?
Nous invitons les développeurs de jeux à découvrir tout le potentiel de speechEngine pour Wwise. Rejoignez-nous sur Discord ou contactez-nous par courrier électronique à l'adresse suivante : gaming@readspeaker.com.
ReadSpeaker s'engage à fournir des solutions vocales utilisant l'IA tout en garantissant une approche éthique. Pour en savoir plus sur cette approche de l'IA vocale éthique dans les jeux vidéo, cliquez ici.
Commentaires