Ilya Viktorov, Audio Lead chez Pixonic (MY.GAMES), a écrit un article sur le design sonore de War Robots : les défis auxquels nous avons été confrontés et les solutions que nous avons mises en œuvre. Que vous débutiez dans le design sonore pour les jeux vidéo ou cherchiez de l’inspiration – cet article vous offrira des conseils pratiques et des pistes précieuses.
Assez étonnamment, le design sonore n’était pas une priorité pour War Robots jusqu’à la quatrième année de développement, vers 2018. À l’époque, les jeux mobiles prêtaient peu d’attention au son en général, se contentant souvent d’assets préfabriqués et des fonctionnalités basiques des moteurs de jeu.
Et lorsque nous avons enfin décidé de prendre le design sonore au sérieux, nous avons hérité d’un lourd passif de contenu existant – ce qui rendait l’idée de tout remanier particulièrement intimidante.
Lors de la création du design sonore, plusieurs contraintes liées au format mobile se sont imposées :
-
Il nous fallait une bibliothèque sonore compacte, à la fois efficace et réutilisable, pour minimiser le stockage et optimiser les performances.
-
Une bonne reconnaissabilité des sons dans un contexte sonore intense.
-
Étant donné les limitations des appareils mobiles, nous devions optimiser nos sons pour une compression forte – un défi qui exigeait planification et rigueur, car à ce stade, implémenter un middleware était trop complexe et coûteux.
La bibliothèque audio FMOD est une norme dans l’industrie, mais au début de notre projet, nous avions décidé de ne pas l’utiliser. (Nous avons essayé de l’intégrer plus tard, mais c’était déjà trop tard.)
Nous avons donc dû reconfigurer et vérifier un très grand nombre d’unités de contenu et des milliers de prefabs. Même avec de l’automatisation, cela aurait pris beaucoup de temps et de ressources humaines – sans parler du fait qu’il aurait fallu suspendre le travail d’autres départements pendant le traitement. Alors, comment avancer ?
Nos cinq approches de production audio
1. Utilisation d’assets prêts à l’emploi
Nous privilégions les abonnements à des bibliothèques sonores plutôt que l’achat de grosses collections que l’on utilise à peine.
Nos services principaux sont Soundsnap, Splice et Soundly (également un excellent gestionnaire de bibliothèque audio). Pour les sons d’armes, nous utilisons aussi parfois le plugin Weaponizer de Crotos, accompagné de sa bibliothèque de composants d’armes.

Krotos Weaponizer
2. Enregistrement de sons
Parfois, il est plus rapide et plus efficace d’enregistrer un son nous-mêmes plutôt que de chercher un asset existant, notamment lorsqu’il nous faut un son spécifique difficile à trouver.
Cependant, enregistrer des sons réalistes pour des robots géants ou des machines lourdes est un vrai défi. Même si vous cherchez une approximation réaliste, enregistrer de vraies machines lourdes est compliqué. Il faut obtenir des autorisations pour entrer sur des sites industriels, sans compter les bruits parasites et la réverbération. On utilise donc des objets plus petits, puis on traite les sons.
En réalité, les sons de mécanismes dans les jeux ou films sont souvent ceux de tournevis, cafetières, serrures de porte, imprimantes ou mixeurs. Exemple culte : le son du blaster dans Star Wars vient simplement d’un jouet Slinky enregistré avec un micro de contact. Dans notre cas, l’objet le plus gros enregistré était un camion-poubelle en train de décharger.
3. Synthèse
Idéale pour les armes énergétiques, les effets magiques et les éléments d’interface. Nous utilisons des synthés à tables d’ondes comme Serum et Vital avec des formes personnalisées, ainsi que des systèmes modulaires comme Softube Modular ou des sampleurs granulaires basés sur NI Reaktor.

Softube Modular
Pour les sons simples comme les bips et les balayages, nous préférons les synthés externes : Mininova de Novation, ou un clone du Minimoog Model D.
Parfois, l’expérimentation mène à des résultats inattendus : la Yamaha RM1X, par exemple, a des réglages d’arpégiateur extrêmes qui produisent des sons glitchy intéressants, parfaits pour des sons d’interface rétro.

Behringer Neutron
4. Réseaux neuronaux
Les réseaux neuronaux sont un domaine encore jeune mais prometteur en audio. Bien que leurs résultats soient encore imparfaits, ils produisent des sons intéressants et parfois inattendus.
Nous utilisons le générateur ElevenLabs pour créer des composants simples, que nous combinons ensuite en assets plus complexes. Même si la qualité finale n’est pas encore atteinte, cela permet de composer des sons mécaniques et magiques en couches.
Nous utilisons aussi le plugin Synplant 2 de Sonic Charge, qui génère des variantes sonores à partir de fichiers de référence. Très efficace pour les effets magiques et les tirs énergétiques.
5. Randomisation
Cela nous permet de générer un nombre infini de sons à partir d’un petit set de matériaux de base. Par exemple, avec quelques dizaines de sons mécaniques, on les charge dans NI Battery, on randomise le point de départ, la hauteur et le volume, puis on utilise un clavier ou un arpégiateur pour produire une variété de sons, dont on garde les meilleurs.
Cette approche peut être combinée avec la synthèse, en générant des valeurs aléatoires ou en ajoutant une couche via Synplant. Nous avons également développé un sampleur personnalisé pour Bitwig, qui charge nos tirs d’énergie en couches (low, punch, snap, tail) et les sélectionne aléatoirement.
En résumé, notre approche est un mix des cinq méthodes. Généralement, nous utilisons les quatre premières pour créer des couches, puis nous les combinons via randomisation.

NI Battery
Intégration des assets audio
Comme mentionné, les capacités basiques d’Unity Audio nous ont poussés à trouver des solutions créatives. Pour garder le contrôle sur les volumes, nous avons catégorisé l’audio : Joueur, Armes, Méchas, Compétences, Ambiance, Musique, UI, Voix. Ces catégories sont ensuite routées vers deux bus principaux – Musique et Effets – gérés via les options du jeu.
Les sons du robot du joueur passent par un flux audio distinct, avec une priorité élevée et un volume augmenté de 10 %. Lorsque plusieurs armes identiques sont équipées, seul le son de l’une d’elles est joué, les autres étant muettes.
Pour éviter les complexités liées aux prefabs multiples, nous avons isolé les assets audio dans des prefabs séparés. Chaque scène contient les sons d’ambiance, musiques, sources ponctuelles et zones de réverb, tous placés aux coordonnées (0,0,0) pour un accès simple. Idem pour les sons d’armes.
Cela facilite la réutilisation rapide des assets audio existants, sans besoin d’en créer de nouveaux à chaque fois. Par exemple, si un game designer crée une nouvelle arme fonctionnellement proche d’une existante, il peut simplement réutiliser le prefab audio correspondant.
War Robots étant actif depuis plus de dix ans, la bibliothèque audio a énormément grandi. Pour limiter sa taille, nous avons compressé davantage les sons peu sensibles à la perte (explosions, sifflements), évité de créer des sons uniques pour chaque remodel et privilégié la réutilisation. Difficile à accepter, car les joueurs attendent des sons uniques, mais nécessaire pour rester dans des tailles gérables.
Les erreurs fréquentes des développeurs
Ne pas utiliser de middleware dans Unity.
Erreur classique mais grave, même chez des équipes expérimentées. Certains pensent que leur projet est trop simple pour nécessiter un middleware, mais c’est faux.
Même un simple jeu match-3 avec une dizaine de sons bénéficiera d’FMOD : gain de temps, qualité sonore améliorée, peu de code à écrire, et poids du build réduit. Pour Unreal Engine, c’est un peu différent : ses outils audio intégrés sont puissants, notamment depuis l’arrivée de Metasound dans UE5. Mais pour des projets AAA, mieux vaut tout de même opter pour WWISE.
Commencer le travail audio trop tard.
Une autre erreur fréquente : sous-estimer l’importance du son. Résultat : peu de ressources allouées et travail repoussé à la fin. Ce retard cause souvent l’insatisfaction des joueurs et des refontes tardives dans des projets déjà en production.
Il est crucial de prévoir dès le départ toute l’infrastructure sonore et de la remplir avec des placeholders.
Ne pas faire appel à des spécialistes.
Sur les petits projets, notamment mobiles, le son est souvent confié à un game designer qui utilise quelques assets publics connectés à la va-vite. Cela donne un rendu pauvre, une baisse de productivité, et souvent un besoin de tout refaire à un moment donné.