Le son de la Nintendo 64

 

Cet article est une version augmentée du thread du 08/05/2019 consultable sur Twitter.

On parle souvent, lorsqu’on faut l’historique de la musique de jeux vidéo, du son sur NES, SNES, des prouesses de leurs compositeurs, et de la fracture avec le support CD et l’arrivée révolutionnaire de la PlayStation. Pourtant, on aborde peu la première console permettant des graphismes en trois dimension de la firme de Kyoto : la Nintendo 64. Une enquête s’est donc imposée pour en découvrir plus sur ce support. Dans cet article, nous allons parler non seulement de ce qu’était la composition pour ce support, mais aussi des difficultés d’interprétation qu’il présente, encore aujourd’hui.

Sortie en 1996, la Nintendo 64 est la première console à affichage 3D en temps-réel de Nintendo. Appartenant à la génération dite « 64-bits », elle a la particularité de persister à lire des jeux sur cartouche alors que le support CD déferle déjà dans l’industrie (pour rappel, la PlayStation est commercialisée depuis 1994 au Japon). Ce choix fait déjà grogner beaucoup de personnes, développeurs comme joueurs. Le support cartouche, en plus de ne pas être très pratique pour développer, a des désavantages d’espace de stockage criants : une cartouche de Nintendo 64 peut contenir jusqu’à 64MB de données. Pour un CD standard utilisé sur PlayStation, on est à 650MB, c’est à dire plus de dix fois plus.

SONY DSC

Qu’à cela ne tienne, si la console ne marche pas très bien commercialement, et que de nombreux studios se détournent de Nintendo pour aller vers Sony, on voit tout de même sortir dessus des jeux légendaires : The Legend of Zelda : Ocarina of Time et Majora’s Mask, GoldenEye 007, Banjo-Kazooie… Aujourd’hui, ces jeux sont restés dans l’histoire, ont été émulés, remasterisés, documentés. Des bandes originales ont même parfois été éditées. Rien à craindre donc, pour la compréhension et la préservation de ce pan de l’histoire ? Que nenni. Il est aujourd’hui très difficile de savoir comment marche le son sur la Nintendo 64, car cette console était en tous points particulière.

Mais faisons les choses dans l’ordre. La première question que je me suis posée au cours de mes recherches est celle de l’existence de la puce sonore de la Nintendo 64. Historiquement, les « sound chips » embarquées dans les consoles (ou les cartouches) sont très importantes. Ces PSG (Programmable Sound Generators), circuits intégrés dans l’infrastructure des consoles, mettent à disposition différentes sonorités qu’il est alors possible de programmer : le son légendaire de la SNES ne serait rien sans le SPC700 de Sony, développé par Ken Kutaragi. De même, la GameBoy et son système sonore intégré au hardware, totalement indépendant du reste des fonctions de la machine, est particulièrement marquante grâce au travail de Hirokazu Tanaka, inspiré de ce qu’il avait fait sur la NES : tout le monde connait aujourd’hui les sonorités « square waves » aujourd’hui emblématique de cette vieille école de composition Chiptune.

waves
Crédit image : Omegatron (CC BY-SA 3.0)

Bien que très limitées, toutes ces consoles se démarquaient donc par leurs productions sonores uniques. La Nintendo 64 les dépassant de loin, les possibilités devaient être meilleures, et les prises de tête techniques moindre, n’est-ce pas ? La réalité est toute autre. Le passage à la Nintendo 64 a représenté un tel changement, que Koji Kondo (compositeur des premiers épisodes de Zelda et Mario), déclare qu’il a arrêté de faire de la programmation sonore à cette époque pour se concentrer sur la composition parce que les choses sont devenues trop compliquées. C’est à ce moment-là qu’il a fallu recruter un programmeur dédié à l’intégration de la musique, les compositeurs ne pouvant plus tout faire à la fois. Dans son interview, Koji Kondo reste également très flou sur les limitations techniques, arrêtant parfois (mais pas toujours) le nombre de voix simultanées à 16. Il en dit peu, également, sur le renouvellement total des sonorités sur cette console. Il y a pourtant beaucoup de choses à relever.

Un synthétiseur dans une cartouche ?

Premièrement : la Nintendo 64 n’est pas conçue avec une puce sonore dédiée. Qu’est-ce que cela veut dire ? Tout simplement qu’aucun module permettant de générer du son n’est présent, de base, dans l’infrastructure de la console. Cela signifie que les studios devaient développer leur propre moteur sonore et leurs propres sons à chaque nouveau jeu. En découle un gros problème au niveau de la gestion des ressources et de la puissance de calcul : sans processeur dédié, le son doit partager les capacités de l’un des deux CPU de la N64 (le RSP : « Reality Signal Processor« ) avec les graphismes. Pour faire simple : plus il y a de sons, plus le jeu est ralenti et moins l’image est fluide. Bien sûr, cela marche aussi dans le sens inverse ! Du coup, si le système permet, en théorie, de jouer jusqu’à une centaine de sons en simultané, le reste des données à gérer fait généralement tomber la limite à seize.

Conker's_Bad_Fur_Day_LogoD’un côté, c’est une fonction intéressante, car les limites de ce que peut faire la console deviennent plus floues. Chaque studio peut choisir d’intégrer le son et le reste comme il le souhaite. C’est ainsi que Rare a développé un algorithme de compression/décompression pour les fichiers mp3 (créé en 1999 et donc encore peu au point). L’algorithme en question a permis d’intégrer du son enregistré dans les cartouches, dont les doublages de Conker’s Bad Fur Day. Pour l’époque et le support, c’est très bien joué :  bien qu’encore un peu difficile à gérer, le mp3 prenait moins d’espace, tout en permettant d’ajouter des sons réalistes de qualité bien meilleure que les intégrations qu’on avait pu voir auparavant. Mais, de l’autre côté, les sonorités possibles vont entièrement dépendre des ressources des studios et des musiciens, qui peuvent être très variables. De plus, les méthodes d’intégration différentes multiplient alors les formats : chaque jeu a sa petite cuisine interne qui n’a rien à voir avec celle des autres.

On peut donc avoir du son enregistré et streamé, ce qui est une grande première à cette échelle sur une console Nintendo. Mais que se passe-t-il lorsqu’il s’agit de sons programmés en MIDI (Musical Instrument Digital Interface), donc typiquement des instructions en langage de programmation qui nécessiteraient une puce pour être jouées, comme c’était le cas sur les anciennes consoles ? Ici, il est nécessaire de préciser un détail important sur le MIDI, car lorsqu’on parle de « sons MIDI », on fait généralement un contresens : si ce protocole sert effectivement à envoyer des instructions concernant le son, le MIDI ne peut pas, à proprement parler « faire » du son, car il n’est que le porteur du message, la « partition ». Cette partition contient un certain nombre d’informations sur la hauteur, la vélocité, la durée, les voix actives, le tempo, le volume, etc. mais pas sur le timbre. Pour produire du son, cette partition doit être lue par des instruments, plus exactement, ces instruments doivent lui être assignés. On peut ici se servir de VSTi (VirtualSoundTrack instrument), dont j’ai déjà parlé dans un thread.

Y a-t-il un « son » Nintendo 64 ?

Vous vous dites probablement : « S’il faut des VSTi pour changer le MIDI en musique, et que la Nintendo 64 n’a pas de soundchip avec les ressources dedans, comment fait-on ? ». On doit alors importer les VST dans la cartouche de notre jeu, tout comme le reste des ressources. J’en arrive ici à mon deuxièmement : la Nintendo 64 n’a pas vraiment de sonorités propres. Comme je l’ai dit précédemment, les studios et compositeurs ne pouvaient compter que sur leurs propres ressources, à savoir : les banques de sons et de samples. Une partie de leur travail consistait donc à naviguer dans les options de leurs synthétiseurs ou à se procurer des CD de « sound libraries » (banques de son) pour construire leurs morceaux. Un fois sélectionnés, les sons étaient découpés et importés dans la cartouche du jeu, dans un format enregistré de type .wav ou en format compressé tel que le .mp3, par souci d’économie.

Peut-être ai-je l’air de rabâcher, mais ce point est fondamental esthétiquement. Dans les années 1990, la musique sortait d’une ère particulièrement riche qui avait vu naître le rock, la pop et la synthpop. Aussi, les banques de sons étaient déjà pléthoriques à l’époque. Bien, sûr, certains « sons » étaient déjà devenus des classiques dans leur genre. Par exemple le clavier du légendaire synthé, le Yamaha DX7. Mais si, vous connaissez forcément « Dire Dire to Break » de Chicago :

 

Ou bien « Hard Habit Docks » de Koji Kondo, je ne suis plus très sûre du titre :

Cet exemple est particulièrement connu et reconnaissable, mais ce n’est pas le cas de tous. Pour vous donner une idée de la façon dont les librairies de samples ont modelé l’esthétique sur Nintendo 64, voici une petit vidéo identifiant quelques sons. On remarque que certaines banques ont été utilisées jusqu’à des épisodes très récents :

Avec cette information en tête, on voit très clairement pourquoi l’écriture mélodique n’était pas toujours au premier plan, par exemple dans The Legend of Zelda : Ocarina of Time. Dans les donjons par exemple, beaucoup de morceaux sont avant tout basés sur la répétition de samples prédéfinis : effets de voix et de flûte dans le Temple de la Forêt, borborygmes dans le Ventre de Jabu-Jabu… Ces quelques exemples peuvent être étendus à tous les sons du jeu, en dehors de quelques sonorités, les voix par exemple, ayant été réalisées en interne. Il n’est donc pas rare de croiser des sons ayant plusieurs origines dans les jeux Nintendo 64 de cette époque. Dans les synthétiseurs les plus marquants utilisés à cette époque, on peut citer notamment le Roland SC-88, le Proteus FX, ou encore les samples de Spectrasonic. Les sonorités marquant le jeu vidéo commencent à venir de multiples sources et fabricants.

Retracer et documenter les sources sonores

Si l’on connaît toutes ces informations aujourd’hui, c’est grâce à la mémoire de quelques compositeurs, mais surtout à l’analyse de connaisseurs qui se sont amusés à décortiquer, analyser et comparer les bibliothèques d’origine avec des listes interminables de samples. Un travail difficile, d’autant plus que toutes les sources potentielles de sons ne sont pas passées dans les mémoires. Quiconque ouvrirait aujourd’hui un jeu Nintendo 64 pour en extraire les sons aurait un mal fou à en déterminer l’origine. Tout d’abord, les versions émulées des jeux ne prennent pas en compte la différence entre MIDI, mp3 etc. : il s’agit d’une partie « encapsulée » dans le code, lue telle quelle.

Pour savoir quels morceaux sont enregistrés et lesquels utilisent un assemblage MIDI/samples, il faut faire du reverse engineering et « casser » l’encapsulage de la ROM pour extraire des équivalents des fichiers originaux. L’opération en elle-même n’est pas toujours très précise. À titre d’exemple, lorsqu’on extrait la partie sonore d’une ROM de Zelda Ocarina of Time, on se retrouve avec 1758 fichiers .wav contenant des SFX, percussions, mais aussi samples et instruments virtuels. C’est énorme, d’autant plus qu’il ne semble pas y avoir de nommage clair ni d’arborescence, et que beaucoup de fichiers sont des doublons.

ootrom

Enfin, si la partie technique est une chose, la compréhension esthétique en est une autre. Tous ces sons ont des origines variées et intéressantes. Mais il est aujourd’hui impossible, à moins de faire une chasse au trésor (déjà entamée par certains), de connaître avec précision les banques employées. Là où on peut, pour la SNES et la GameBoy, s’appuyer sur des données très fiables et déterminées pour retracer le travail stylistique des compositeurs, il est impossible de faire pareil pour la Nintendo 64 : chaque studio, chaque jeu, a eu un fonctionnement différent vis-à-vis du son. Précisons que l’intérêt, pour certains, de trouver l’origine de ces sons, est d’avoir accès à une version de meilleure qualité : un sample prend plus de place qu’une forme d’onde, la plupart des extraits étaient donc compressés pour tenir sur les cartouches.

Une question d’intégration

Je n’ai pas encore parlé des méthodes d’intégration en lien avec ce support, car elles ont bien sûr évolué avec la façon de faire les jeux. Dans ce cas, il faut reconnaître deux points positifs propres au format cartouche de la Nintendo 64 : l’absence de temps de chargement et l’existence de MusyX. MusyX est un logiciel développé par Factor 5 en 1999, qui visait alors à faciliter le travail de composition et d’intégration de sons ayant plusieurs origines différentes, le tout en donnant un aperçu du résultat tel qu’il se présentait sur la console. C’était à l’époque une grande première, puisque jusqu’à ce moment-là, il était difficile de se faire une idée du rendu final d’une composition sans passer par une cartouche. Cela provoquait alors des allers-retours particulièrement fastidieux puisque les compositeurs devaient écrire leurs morceaux, les graver sur une cartouche, les faire jouer par la console, et relever les problèmes avant de recommencer.

Ici, la prise de tête est moindre : toute l’infrastructure musicale est directement créée dans MusyX avant d’être intégrée dans la cartouche. La planification de l’interactivité est même simplifiée grâce à certaines fonctions, par exemple de priorisation des voix, permettant de décider dès la composition quels éléments sonores ont l’ascendant sur les autres en cas de chevauchements. Mais pour nous, les choses ne sont pas facilitées : comme tout bon software de développement réalisé en interne, MusyX reste assez mystérieux… De même que les productions qui en sortent, supportant différentes façons de faire.

La façon de concevoir la musique et le son a donc totalement changé sur Nintendo 64 : les compositeurs ont eu accès à plus de sons et ont vu leur travail facilité, mais la complexité technique de ce nouveau support a également imposé de gros changements. Dans l’organisation des équipes tout d’abord, avec de nouvelles façon de répartir les tâches techniques et artistiques, mais aussi dans la façon d’écrire et de jongler avec les nouvelles limites des ressources disponibles. Cette évolution représente un moment fondamental dans l’histoire de la musique de jeu vidéo, puisqu’elle va se démocratiser sur les consoles suivantes, qui vont pour beaucoup reprendre et améliorer ces quelques concepts, tout en ouvrant la voie aux enregistrements et manipulations en studio.

2 commentaires

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s