Dans la tête d'Alan Wake 2 : distinguer les dialogues

Contenu sonore pour les jeux vidéo

Dans la tête d'Alan Wake 2 : série d'articles

Dans la tête d'Alan Wake 2 est une exploration détaillée des processus créatifs et techniques qui ont façonné l'expérience audio du jeu. Cette série d'articles explore les décisions minutieuses, les défis et les innovations qui se cachent derrière l'univers sonore d'Alan Wake 2. De la création de dialogues dynamiques et d'Échos immersifs au rôle essentiel du contrôle qualité (QA) audio, en passant par le système de profilage unique du jeu, plongez dans l'esprit de l'équipe audio qui a donné vie à cet univers.

Dans ce premier volet, les concepteurs de dialogues seniors Arthur Tisseront et Taneli Suoranta nous emmènent dans les coulisses de l'implémentation des dialogues d'Alan Wake 2, en analysant l'interaction entre les dialogues parlés et la narration, et en expliquant comment la conception audio a contribué à maintenir une bonne clarté dans un monde où la réalité est en constante évolution.

Distguer les dialogues dans Alan Wake 2-thumbnail-final

Introduction : Distinguer les dialogues

Alan Wake 2 a présenté plusieurs défis uniques en matière d'implémentation des dialogues. Ce jeu, qui met en scène un écrivain et des histoires qui prennent vie, est narré par deux personnages jouables différents (Saga Anderson et Alan Wake), avec une interaction constante entre la narration et les dialogues parlés, le tout n'étant pas nécessairement soumis aux lois de la réalité. Cela nous a donné une grande liberté pour jouer avec l'implémentation afin d'obtenir un résultat à la fois cohérent avec le contexte de l'histoire, mais aussi intéressant et informatif pour le joueur.

Structure Wwise

La manière dont les dialogues sont intégrés au moteur Northlight de Remedy nous permet d'utiliser des fichiers sources externes (« External Source ») – aucun fichier de dialogues du jeu ne se trouve dans Wwise lui-même. Wwise nous permet essentiellement de contrôler de manière granulaire la catégorisation de chaque ligne de dialogue en fonction de sa spatialisation et de ses bus d'effets, tout en nous laissant gérer les fichiers ailleurs comme nous le souhaitons. Nous utilisons des outils internes pour attribuer des lignes de dialogue à des Events Wwise (que nous appelons « types de dialogue ») qui définissent la manière dont ces lignes doivent être spatialisées lors de l'exécution du jeu. Cela nous a permis d'attribuer aux dialogues les mêmes règles générales en matière d'atténuation, d'obstruction et d'autres conditions de jeu, tout en gérant les cas particuliers par l'ajout d'un nouvel Event avec les paramètres dont nous avions besoin (par exemple, pour contourner l'occlusion sur un ensemble spécifique de lignes). Cela a également conduit à une structure globale de bus plus simple.

Alan-Wake-2-Wwise-Property-Editor

Utiliser ainsi les sources externes nous a permis de conserver un projet Wwise léger et rapide à charger – nos dossiers de sources externes contenaient plusieurs milliers de lignes, environ 27 000 au total pour chaque langue, qui n'avaient pas besoin d'être chargées à l'ouverture de Wwise.

La seule exception à cette règle concernait les cinématiques : l'audio de toutes les cinématiques du jeu a été conçu au préalable et lu via des Events Wwise uniques, avec un Event par cinématique, et avec des dialogues au format 7.1 routés vers un bus de sortie en 7.1.4. Cette méthode nous a permis d'avoir une synchronisation toujours précise avec l'image ainsi que la meilleure qualité de mixage possible pendant les cinématiques, tout en nous permettant d'effectuer de manière offline les traitements sonores / interactions de SFX que vous pouvez entendre à ces moments-là.

En raison de cette utilisation de sources externes, nous n'avons pas pu mixer individuellement chaque asset de dialogue directement dans Wwise. Pendant la production, il était extrêmement important que les éléments soient pré-mixés selon nos spécifications avant de passer par Wwise – et, comme nous disposions d'un temps limité pour réaliser le mixage final du jeu, il était essentiel de disposer d'éléments pré-mixés selon nos spécifications après les sessions d'enregistrement. En ce sens, le mixage a été réalisé de manière itérative pendant le processus d'implémentation – il n'a pas vraiment été nécessaire de procéder à un mixage final des dialogues dans Wwise, en dehors des ajustements généraux apportés aux types de dialogues.

Qu'est-ce que la narration, au juste ?

Pour illustrer la manière dont nous avons utilisé ces types de dialogues, commençons par la distinction entre narration et dialogues parlés. Pour nous, cela signifie :

  • Dialogue parlé : un personnage parle à voix haute, en bougeant physiquement la bouche.
  • Narration : un personnage exprime ses pensées dans sa tête, ou raconte l'histoire au fur et à mesure qu'elle se déroule.

Bien que ces deux catégories de dialogues n'étaient pas les seules, elles étaient les plus importantes pour donner du sens à notre jeu. 

Nous voulions approfondir autant que possible cette distinction afin que le joueur sache toujours clairement qui parlait et si les personnages s'exprimaient à voix haute. De plus, il pouvait parfois y avoir plusieurs « narrateurs » dans une même scène – par exemple, Alan racontant l'histoire depuis l'Antre Noir (« Dark Place »), pendant que Saga exprime ses pensées intimes dans la même partie du jeu, en plus des dialogues parlés, comme dans cet extrait de gameplay :

Dans l'ordre, nous entendons :

  • Saga parlant à voix haute
  • Saga exprimant ses pensées
  • Alan racontant l'histoire depuis l'Antre Noir
  • Saga exprimant à nouveau ses pensées

Cet extrait devrait vous donner une idée des raisons pour lesquelles nous avions besoin de faire ces distinctions.

Les dialogues parlés sont toujours spatialisés sur la tête du personnage du joueur et bénéficient d'un envoi de réverbération défini par le jeu (« Game-Defined Send »). Cela nous permet déjà d'obtenir une assez bonne distinction entre les deux types de voix. Nous avons également poussé les dialogues parlés vers l'avant dans le Speaker Panner de Wwise afin d'accentuer encore cet effet.

Alan-Wake-2-Wwise-Speaker-Panner

En outre, les dialogues parlés et narrés ont été masterisés différemment avant d'être intégrés à Wwise. Matthew Porretta, la voix d'Alan, possède un pic de résonnance très agréable à environ 110 Hz. Celui-ci a été accentué pour ses dialogues narratifs via une compression multibande et un égaliseur soigneusement réglé, puis atténué pour ses dialogues parlés – nous avons procédé de manière similaire pour Saga et ses deux types de dialogues. Les narrations de Saga et Alan disposent également d'un traitement en temps réel – un simple délai stéréo (Wwise Stereo Delay) à très faible volume.

Alan-Wake-2-Wwise-Stereo-Delay

Tous ces petits détails ont contribué à clarifier quels dialogues étaient destinés au monde et lesquels étaient destinés à la narration – mais nous ne nous sommes pas arrêtés là.

Respirations

En plus des dialogues eux-mêmes, nous avons choisi de créer un système de respiration pour chaque personnage jouable afin de les connecter encore davantage au monde. Saga et Alan respirent tous deux constamment tout au long du jeu, comme le ferait une personne, avec un rythme et un ton de respiration adaptés à la situation dans laquelle ils se trouvent. Nous avons pu tirer parti de l'Auto-Ducking et des States de Wwise pour rendre la narration et les dialogues parlés encore plus distincts : les dialogues parlés interrompent la boucle de respiration du personnage pendant leur durée, puis la réactivent après un court délai. Ce n'est pas le cas de la narration. C'est une distinction subtile, mais qui aide le joueur à deviner si le personnage parle à voix haute ou non.

Le système de respiration s'intègre dans la hiérarchie musicale, chaque respiration constituant un clip musical individuel. Il comporte trois States principaux : détendu (« relaxed »), danger, et en combat (« engaged »), avec des variantes stop (lorsque le personnage est immobile), marche (« walk »), et course (« run ») pour chacun, en plus d'un State blessé (« wounded ») lorsque le joueur a peu de santé. 

Alan-Wake-2-Wwise-système-de-respirations

Chaque State peut passer de manière fluide à un autre State grâce aux transitions du système de musique interactive de Wwise, et les personnages joueurs « récupèreront leur souffle » après avoir couru un moment ou être passés d'un état d'intensité élevée à un état d'intensité faible, imitant ainsi la façon dont les gens ont besoin de reprendre leur souffle après un effort physique. 

Alan-Wake-2-transitions-du-système-de-musique-interactive-de-Wwise

Une période de récupération est un ensemble sélectionné de respirations de chaque type qui donne l'impression que le personnage ralentit son effort, et qui est chronométrée et séquencée manuellement comme suit :

Alan-Wake-2-Wwise-récupérations-de-respirations

Alan s'essouffle beaucoup plus vite et respire beaucoup plus difficilement que Saga, car, comme on peut s'y attendre, il est en bien moins bonne forme physique qu'une agente du FBI entraînée. Tout cela est lié à la fréquence cardiaque du personnage du joueur, qui augmente lors d'actions telles que courir ou être attaqué, et diminue dans les zones calmes – une fréquence cardiaque plus élevée a pour conséquence d'accélérer la lecture des respirations. Chaque personnage jouable disposait d'un peu plus de 1 000 assets individuels de respiration pour prendre en charge ce système, divisés en familles d'assets pour les inspirations et expirations, bouche ouverte et fermée, tout cela afin d'apporter de la variété.

Alan-Wake-2-système-de-respirations-Wwise

Nous avons également ajouté un sidechain provenant des pas du joueur et appliqué à cette boucle de respiration – chaque pas atténue rapidement la respiration du joueur, la course lente et la course rapide ayant l'effet le plus important. L'objectif était d'imiter ce qui se passe lorsqu'une personne expulse plus d'air de ses poumons lors de pas lourds. Bien que, techniquement, c'est l'effet inverse qui se produit (dans la vie réelle, cela se traduit par une plus grande quantité d'air expulsée à chaque pas), le rythme que cela donne à la respiration est similaire, et l'effet d'augmentation du volume à chaque pas ne nous a pas semblé très naturel lors de nos tests. Lorsque le joueur court, voici à quoi ressemble le graphique de Voice Volume d'une respiration :

Alan-Wake-2-graphique-volume-voix

Dans le mixage, les respirations sont souvent à peine audibles – nous voulions qu'elles soient ressenties plutôt qu'entendues, en dehors des moments tendus se déroulant dans les zones calmes. Ci-dessous, voici une vidéo du jeu avec le volume des respirations considérablement augmenté, afin d'entendre comment elles sont reproduites et comment certains de ces choix systémiques se manifestent dans le jeu.

Nous pensons que cette attention portée à la manière dont nous avons connecté les personnages jouables aux mondes qu'ils habitent a contribué à établir un lien plus fort entre eux et le joueur, rendant les rebondissements de l'histoire encore plus marquants pour le joueur lui-même.

Nous voulions nous assurer que les ennemis contribuent eux aussi, à leur manière, à ces rebondissements.

Le dialogue comme ambiance – Ombres et Antre Noir

Dans la partie du jeu consacrée à Alan, le joueur traverse l'Antre Noir, un lieu sombre se situant dans une dimension cauchemardesque surréaliste créée à partir des propres histoires d'Alan. Il est ainsi hanté par ses propres échos – des ombres qui apparaissent dans son champ de vision. Ces ombres lui répètent constamment ses propres paroles dans un murmure – jusqu'à ce qu'elles deviennent agressives et se mettent à crier.

L'un des plus grands défis lors de la création de l'atmosphère de l'Antre Noir a été d'implémenter les chuchotements de manière à ce qu'ils ne deviennent pas irritants au fil du temps – nous avions parfois des dizaines d'Ombres dans une seule zone, et il était donc important d'éviter un déluge de chuchotements constants – ce qui aurait complètement tué la tension du moment. Nous voulions également nous assurer que le joueur ne sache jamais vraiment se trouvaient les Ombres jusqu'à ce qu'elles soient juste au-dessus de lui, les chuchotements ne pouvaient donc jamais être trop forts. Le défi ici était que, au-delà de trouver le bon rythme pour les chuchotements dans le système que nous utilisions pour les générer, ceux-ci pouvaient apparaître n'importe où dans l'Antre Noir – à l'extérieur ou à l'intérieur – et en nombre illimité. Nous ne pouvions pas garantir que leur plage d'atténuation audible fonctionnerait dans toutes les situations. 

Notre solution a consisté à placer ces chuchotements dans des Blend Containers liés à la position en intérieur (« interiority ») ou à l'extérieur du joueur. L'atténuation à l'extérieur est environ 10m plus longue qu'à l'intérieur. Cela nous a permis de conserver le rythme systémique que nous avions soigneusement réglé dans tout l'Antre Noir sans amener de complexité supplémentaire du côté du script.

Alan-Wake-2-Wwise-Blend-Container

Monstres et boss

L'implémentation la plus compliquée concernant les dialogues des ennemis se situait durant nos combats contre les boss. Dans la plupart des cas, les boss pouvaient se téléporter, sortir complètement de l'écran ou quitter la réalité dans laquelle évoluait le joueur, mais ils devaient néanmoins rester présents et menaçants tout au long du combat. Prenons l'exemple de Cynthia :

Au cours de la première phase de ce combat, elle passait la plupart de son temps sous l'eau, totalement invisible pour le joueur. Elle pouvait ainsi être n'importe où – et nous devions faire comprendre qu'elle était toujours présente, attendant que le joueur commette une erreur pour pouvoir l'attraper. Du côté du moteur de jeu, elle était complètement cachée et immobile, nous ne pouvions donc pas utiliser son emplacement dans le jeu pour y associer du dialogue. De plus, Tor, la personne que Cynthia a enlevée pour l'emmener dans son royaume sous-marin cauchemardesque, crie également sur le joueur tout au long du combat. Il se passe beaucoup de choses.

Pour bien rendre tout cela, nous avons utilisé une combinaison de l'option de spatialisation « Listener with Automation » (Listener avec automation) de Wwise et de quelques réponses impulsionnelles de convolution personnalisées et originales (les mêmes que celles employées normalement sur les envois auxiliaires de l'Antre Noir), afin que Cynthia donne l'impression d'être sous l'eau tout en continuant à parler au joueur. Lorsque le joueur n'est pas activement poursuivi, le dialogue de Cynthia est répété en boucle, flottant et tournant autour du Listener de manière aléatoire, afin de donner l'impression de se situer tout autour du joueur. Nous avons utilisé le type de spatialisation « Steering » de Wwise pour forcer sa position à toujours sembler légèrement en dessous du joueur.

Alan-Wake-2-Wwise-Listener-with-Automation

Lorsque Cynthia commence à poursuivre le joueur, nous revenons à une spatialisation normale, attachée à sa présence physique dans le monde car, à ce stade, le joueur doit savoir exactement où s'enfuir.

Tor est statique, centré et fixé sous l'arène, mais avec la même réverbération que Cynthia afin que le joueur puisse intuitivement comprendre qu'ils se trouvent dans la même dimension globale.

Nous avons utilisé des astuces similaires chaque fois que d'autres boss sortaient de l'écran, comme c'est souvent le cas – dans le combat contre Nightingale, le premier boss du jeu, celui-ci peut se téléporter hors de l'écran après une attaque spéciale et surprendre le joueur en apparaissant hors de son champ de vision pour l'attaquer à nouveau. Le même type d'automation a été appliqué à son dialogue lorsqu'il est hors champ afin d'indiquer que cela se produit.

Visuels contrôlés par l'audio

Les dialogues ont également été utilisés pour contrôler les visuels de certaines parties essentielles du jeu – les scènes d'Échos – des images fantomatiques provenant d'autres réalités dispersées dans l'Antre Noir - et certains types de pages de manuscrits que l'on peut trouver tout au long du jeu. Ces dialogues ont été acheminés vers un envoi d'effet à l'aide d'un plugin Wwise personnalisé, QAnalyzer, qui nous a permis d'envoyer les données RMS de sortie du bus au moteur du jeu lors de l'exécution :

Alan-Wake-2-plugin-personnalisé-QAnalyzer

Ces valeurs ont été utilisées par l'équipe de VFX pour créer les effets visuels clignotants et audio-réactifs que le joueur rencontre dans le jeu – et ont également été un moyen supplémentaire pour aider à différencier les narrateurs dans la scène en cours.

Les dialogues des scènes d'Échos sont joués selon leur propre type de dialogue, spatialisés à l'endroit où l'Écho existe physiquement dans le monde, mais avec une réverbération supplémentaire pour indiquer que ce que vous entendez ne provient pas de votre réalité actuelle.

Atténuation, occlusion et cas particuliers

Tous ces efforts pour spatialiser les éléments de manière intéressante et distincte n'auraient servi à rien si nous n'avions pas disposé de calculs suffisamment détaillés en matière d'occlusion, d'obstruction et de propagation. Sans cela, les dialogues parlés n'auraient presque jamais semblé naturellement positionnés dans le monde, en particulier lorsque le joueur se déplace pendant la lecture du dialogue.

Les calculs d'obstruction et d'occlusion ont été développés sur mesure par nos programmeurs audio, Iiro Rossell et Samuel Andresen. Une série de sondes acoustiques, des points dans le monde que le jeu peut utiliser pour tenter de connecter les émetteurs au Listener via un tracé de ligne, sont placées de manière aléatoire dans l'environnement au moment de l'exécution. 

Alan-Wake-2-Wwise-Obstruction-Occlusion

Ces sondes, en plus de celles placées manuellement dans des zones sensibles comme les portes et les géométries intérieures denses, sont utilisées pour calculer les données d'obstruction et d'occlusion en fonction d'un ensemble de critères :

  • La distance entre la sonde la plus proche et le Listener
  • Le nombre de sondes qu'un son doit traverser depuis l'émetteur pour atteindre le joueur
  • Si le chemin de la sonde est interrompu par une géométrie solide et si ce matériau est acoustiquement transparent

Si un son subit de l'occlusion, ce système déplace également physiquement l'emplacement de son émetteur vers la sonde la plus proche dans la ligne de visée directe du joueur, imitant ainsi la façon dont le son se propage autour des objets solides, et non à travers eux.

À partir de ces données, des courbes d'obstruction et d'occlusion ont été définies au niveau du type de dialogue. Nous disposions d'un ensemble standard d'atténuations pour différentes distances audibles utilisées dans la plupart des endroits du jeu, avec quelques exceptions pour des cas particuliers, par exemple lorsque le dialogue ne devait présenter aucune occlusion/obstruction, ou nécessitait un traitement temps réel spécifique.

Alan-Wake-2-Wwise-Effects-tab

Nous avons choisi de ne pas utiliser l'angle d'atténuation (« Cone Attenuation ») et avons très peu appliqué de Spread sur les dialogues, car nous estimions que cela rendait l'intelligibilité et le positionnement incohérents lorsque les personnages bougeaient la tête.

Note concernant les performances d'acteur

Une grande partie de cet article traite des astuces d'implémentation originales et des détails techniques que nous avons utilisés pour améliorer la sensation des dialogues dans le jeu – mais avant de conclure, nous tenons à souligner que rien de tout cela n'aurait eu d'importance sans les performances incroyables de Matthew Porretta dans le rôle d'Alan Wake, de Melanie Liburd dans celui de Saga Anderson, de tous nos autres personnages principaux et boss, ou de nos 21 merveilleux acteurs de NPC ennemis qui ont incarné les Corrompus. Ils ont tous apporté leur touche personnelle à leurs personnages, et sans cela, les dialogues n'auraient pas eu le charme qu'ils ont, peu importe le soin et les efforts de spatialisation que nous leur avons accordés. Comme les répliques des Corrompus proviennent directement des pages du manuscrit de Wake, l'écriture de Sam Lake et Clay Murphy est également un élément essentiel sur lequel repose l'implémentation. Aucune finition technique ne peut remplacer une interprétation exceptionnelle de répliques exceptionnelles – elle ne fait que mettre encore plus en valeur ces performances.

Conclusion

Dans un jeu comme Alan Wake 2, qui regorge de séquences folles et iréelles, et qui nécessite des dialogues uniques pour les accompagner, la flexibilité des systèmes de Wwise nous a permis de faire tout ce dont nous avions besoin, quand nous en avions besoin. La plupart des implémentations ne sont pas incroyablement complexes en elles-mêmes, mais elles ont dû être ajustées et mûrement réfléchies dans le contexte de toutes les autres parties du jeu afin de ne pas devenir envahissantes ou inadéquates pour le joueur. Ce niveau d'implémentation artisanale n'aurait pas été possible sans les fonctionnalités offertes par Wwise.

 

Arthur Tisseront & Taneli Suoranta

Arthur Tisseront & Taneli Suoranta

Arthur Tisseront

Passionné depuis toujours par les jeux vidéo et les histoires qu'ils racontent, Arthur occupe actuellement le poste de Concepteur de Dialogues Senior chez Remedy Entertainment. Depuis ses débuts dans l'industrie du jeu vidéo, il met à profit son expérience d'acteur de doublage et de concepteur audio pour créer des dialogues pour une multitude de jeux, notamment The Callisto Protocol et Alan Wake 2.

BlueSky

LinkedIn

Taneli Suoranta

Concepteur de Dialogues Senior chez Remedy. Diplômé d'un master de l'école de cinéma Aalto Arts et concepteur sonore avec plus de dix ans d'expérience dans le domaine.

LinkedIn

Commentaires

Laisser une réponse

Votre adresse électronique ne sera pas publiée.

Plus d'articles

Licence Indé gratuite de Wwise | Le meilleur de l'audio au service des développeurs indépendants

Créer une expérience audio immersive correspondant à la vision de votre projet peut être une chose...

18.7.2024 - Par Audiokinetic

Récapitulatif des sessions de l'Audiokinetic Theater | GDC 2024

Cela a été un honneur incroyable d'accueillir tous les professionnels de l'audio venus présenter...

12.3.2025 - Par Audiokinetic

Découvrir les coulisses du foley d'Unpacking

Unpacking est un jeu qui reproduit l'expérience bien connue de sortir ses affaires de cartons de...

25.6.2025 - Par Jeff van Dyck

Reverse Collapse : Code Name Bakery | Le rôle important de Wwise dans la collaboration à distance

Studio X Labs a eu le privilège d'assurer l'intégralité de la conception sonore, de la programmation...

23.7.2025 - Par Paul Ruskay & Ruohao (Jater) Xu

Procédés d'optimisation audio dans Scars Above

Introduction Dans ce document, je vais tenter d'expliquer les différents principes que nous avons...

13.8.2025 - Par Milan Antić

Dans la tête d'Alan Wake 2 : conception sonore des Échos dans Wwise

Dans la tête d'Alan Wake 2 : série d'articles Dans la tête d'Alan Wake 2 est une exploration...

29.10.2025 - Par Tazio Schiesari

Plus d'articles

Licence Indé gratuite de Wwise | Le meilleur de l'audio au service des développeurs indépendants

Créer une expérience audio immersive correspondant à la vision de votre projet peut être une chose...

Récapitulatif des sessions de l'Audiokinetic Theater | GDC 2024

Cela a été un honneur incroyable d'accueillir tous les professionnels de l'audio venus présenter...

Découvrir les coulisses du foley d'Unpacking

Unpacking est un jeu qui reproduit l'expérience bien connue de sortir ses affaires de cartons de...