* Travailler sur un jeu n’a rien à voir du tout avec travailler sur un doublage (de dessin animé ou non).
On est seul dans une cabine devant le micro et un écran d’ordinateur sur lequel on ne voit que le logiciel de son utilisé et le fichier qui s’enregistre, avec le curseur qui bouge.
La seule véritable contrainte consiste en ceci qu’il faut parfois (souvent mais pas toujours) faire un fichier son de la même longueur exactement que le fichier son original (qu’on nous montre alors en référence – le fichier français que nous faisons étant alors visible juste en-dessous) et qu’il faut généralement parler plutôt fort.
Le plus souvent nous n’avons aucune image qui puisse servir de référence, et on enchaîne l’enregistrement des phrases sans avoir de partenaire, de sorte qu’on joue dans le vide totalement. La seule chose à laquelle on puisse un peu se raccrocher est la version originale, qu’on nous envoie dans le casque (fichier par fichier) juste avant qu’on enregistre le texte en français qui est toujours assez court.
Mais il n’est pas rare qu’on ne comprenne pas bien (voire pas du tout) la situation, ni dans quel sentiment il faut jouer le texte ou à quoi on est supposé réagir, et le directeur artistique n’a pas toujours beaucoup de renseignements pour nous aider. Il arrive donc qu’on se demande vraiment dans quelle direction il faut aller, l’original n’ayant parfois pas du tout un sens évident.
On a parfois des personnages amusants à faire, bien sûr, mais c’est la plupart du temps fatigant et fastidieux. Et la voix peut en prendre un sacré coup quand il s’agit d’enregistrer d’affilée des dizaines de fichiers de cris divers.
* Pour la version originale d’un dessin animé, on enregistre les textes avant, les dessins étant fabriqués ensuite en fonction de ceux-ci. Du moins quand il y a une certaine volonté d’animation car j’ignore comment cela se passe pour les séries de dessins animés nippons sur lesquels l’animation est très sommaire en général (et celles des bouches en particulier).
C’est fondamentalement différent du travail sur les jeux. On nous montre les personnages dont on va faire les voix, on a un story-board, on sait ce qu’on joue et dans quelle situation on est, on a la continuité de l’histoire, le réalisateur est là pour nous guider, et on peut travailler avec nos partenaires. Donc, même si on a la contrainte de ne jamais se chevaucher dans nos répliques, on peut quand même parfois jouer un minimum ensemble, ce qui en principe (pas toujours, mais le plus souvent) est quelque chose qui aide. De plus on joue au rythme de son choix et on peut créer beaucoup plus librement. Tout ça fait qu’on n’est pas du tout dans le vide, en réalité. On se retrouve dans des conditions similaires à celles de l’enregistrement d’une dramatique radio. On doit interpréter un rôle, tout simplement. Rien à voir donc ni avec les jeux ni avec le doublage où l’on est plus ou moins contraint de reproduire ce qui a déjà été joué avant nous.
Toutes les stars qu’on entend dans les versions originales ont donc travaillé de cette façon, contrairement à ce que devront faire ensuite les « noms connus » à qui on fera appel en France pour faire le doublage et qui seront confrontés à cette technique contraignante très particulière, qui ne permet pas toujours de donner libre cours à toute l’étendue de son talent quand on ne la maîtrise pas bien.
* Enregistrer un documentaire est encore un autre exercice.
Dans un documentaire on rencontre deux types d’interventions vocales : la narration et ce que nous appelons en bon français (…) les voice over.
Ces dernières sont, comme leur nom l’indique, les espèces de traductions simultanées en français de ce que dit à l’image dans sa langue originale un personnage interviewé et qu’on entend en arrière fond. La voix française (voice) est donc par-dessus (over) la voix originale, laquelle est toujours audible bien qu’incompréhensible.
Contrairement à la narration, ce sont la plupart du temps des passages assez courts et rarement complexes. La seule contrainte consiste à essayer de démarrer son texte en français un petit instant après que la personne à l’image a commencé à parler et de terminer un peu avant elle, de sorte que le spectateur puisse entendre un peu son timbre de voix et sa façon de s’exprimer. On a généralement le temps d’écouter le passage et de lire son texte avant de l’enregistrer, afin de se rendre compte du rythme qu’il faudra adopter. Du reste, lorsqu’on enregistre, on a dans le casque le texte de la personne interviewée, qui peut nous servir de repère. Très souvent malheureusement les adaptateurs racourcissent trop la traduction française, de sorte que cette traduction « simultanée » risque de devoir laisser trop de blancs entre les phrases ou d’être trop lente pour couvrir correctement le passage. Il n’est pas toujours aisé de trouver un moyen terme. A l’inverse il faut parfois aller vite (ou supprimer du texte) pour caser une traduction qui, pour dire la même chose que ce qui est dit dans l’original, ne peut pas éviter d’avoir plus de mots en français. Toutefois l’exercice n’est pas très compliqué. Et lorsqu’on a repéré le rythme et le ton des personnages qu’on voice overise (si je puis me permettre cet épouvantable néologisme) on peut essayer de se lancer à enregistrer sans les écouter auparavant et en découvrant son propre texte. Il est fréquent que cela puisse se faire ainsi, « à la volée », sans dommage pour la qualité du travail.
En revanche, le travail de narration est plus délicat et plus contraignant.
Pour ce qui le concerne il se fait presque toujours à la volée. On n’a pour ainsi dire jamais eu le texte à l’avance et, généralement, c’est en l’enregistrant qu’on le découvre. On ne l’a même pas lu juste avant.
C’est une gymnastique qui demande une grande concentration car il s’agit à la fois de comprendre ce qu’on est en train de dire et de le phraser correctement, de percuter lorsqu’on a affaire à des fautes de français, des fautes de frappe ou des incohérences, d’anticiper du coin de l’œil sur la suite dès que c’est possible, de surveiller son articulation, sa respiration (afin qu’elle ne soit pas sonore), ses bruits de bouche (claquements de langue, bruits de salive, etc.), de suivre les images et le time code à l’écran pour s’assurer qu’on est dans le bon rythme, et enfin, c’est la moindre des choses, de faire attention à ne pas être (trop…) endormant.
Bien entendu on s’arrête lorsqu’il le faut pour telle ou telle raison, on prend le temps de lire le passage et on le reprend ensuite. De leur côté, le preneur de son et le directeur artistique (lorsqu’il y en a un, car ce n’est pas toujours le cas) sont attentifs au bon déroulement de notre narration. Malgré tout, cela n’empêche pas qu’on laisse de temps en temps passer des erreurs (de texte, de prononciation, etc.) que le spectateur peut ensuite être étonné d’entendre si personne ne les a relevées par la suite avant le passage à l’antenne, car le rythme d’enregistrement étant assez soutenu la vigilance de chacun peut être prise en défaut. Et lorsque la narration est longue, abonde en éléments techniques, en considérations scientifiques, en chiffres, en termes inhabituels, en noms propres divers, l’exercice exige une tension qui peut être très fatigante et même devenir assez fastidieuse parfois.
Et cette façon de travailler a pour conséquence qu’on n’a hélas pas le temps de profiter des images souvent intéressantes qu’on commente et que le plus souvent on ne retient malheureusement pas du tout ce qu’on a dit. Toute l’attention est en effet concentrée sur une compréhension immédiate, instantanée, sur le fait de phraser correctement les choses (sujet, verbe, complément, phrase principale, proposition incidente, etc.) et cette focalisation ne permet pas à la mémoire de retenir en profondeur tout ce qu’on a expliqué. C’est-à-dire que les éléments ne s’impriment pas dans une mémoire de masse mais dans une mémoire vive, en quelque sorte, volatile et provisoire.