/lifestyle/techno
Navigation

Créer une voix: de l’artificiel au réel

Créer une voix: de l’artificiel au réel

Coup d'oeil sur cet article

En collaboration avec
  


La voix n’est pas un son comme les autres! Reproduire une voix humaine, c’est un défi immense.
Chacun des principaux acteurs de l’industrie numérique l’a d’ailleurs bien compris en proposant un assistant vocal avec une voix à son « image ». Si les banques, hôtels et grands magasins disposent aussi de serveurs vocaux pour répondre à leurs clients, il reste que concevoir des mots qui « sonnent » comme s'ils étaient réels, c’est complexe. Comment ça marche?

  

La voix de son maître
Constat numéro un : chaque voix est unique. L’air fait vibrer les cordes vocales. Ça donne une couleur personnelle. Ça traverse ensuite le larynx et la bouche, aux formes variables. Si on ajoute la personnalité et la vitesse, le résultat n’est jamais exactement le même.

Comment parvenir à imiter la voix humaine? La difficulté est dans la précision des intonations, pour les rendre conformes aux différentes fins de phrase. Telle ou telle phrase se termine-t-elle par un point, un point d’interrogation ou un point d’exclamation? Auparavant, pour y arriver artificiellement, on enregistrait les paroles, puis on les déformait, pour un résultat mi-humain, mi-synthétique, un peu étrange.       


Le feu d’artifice
Depuis le début du siècle, l’approche évolue : des algorithmes d’apprentissage gobent des milliers de phrases enregistrées, puis analysent les inflexions naturelles à reproduire. Avec les sons obtenus, on reforme les mots, puis on les module, un peu comme le font les vedettes de la chanson qui utilisent Auto-Tune pour chanter plus juste.      

En somme, l’intelligence artificielle, avec son réseau de neurones qui étudient ces enregistrements, génère un modèle statistique et des phrases, de manière à former des voix encore plus artificielles... qui auront l’air naturelles!

  

Ressusciter Louis et Marilyn
Alors que le « tournez à gauche » du GPS manquait clairement de fluidité et de personnalité, les algorithmes de vocalisation imitent aujourd’hui la voix de n’importe quelle personne à partir d’enregistrements. Au point de pouvoir faire revivre les voix de certaines personnalités disparues, par exemple Marilyn Monroe ou Louis de Funès.

  

De célèbres assistants
De nouvelles voix, bien vivantes, se remarquent aussi chez les assistants pour enceintes et téléphones intelligents : le compositeur John Legend a prêté sa voix pour Google, tandis que l’acteur Samuel L. Jackson a fait la même chose pour Alexa (Amazon). À suivre, en 2020.       

La voix de Mister T. a pour sa part intégré le marché des GPS. Attention toutefois au «Turn left, fool!» qui se fera entendre si vous ne suivez pas ses consignes! Ces vedettes enregistrent leurs séquences de phrases en studio, se faisant diriger par des réalisateurs qui ajoutent souvent des touches d’humour.       

La voix qu’on aime
La voix de synthèse peut effrayer : remplacera-t-elle les guides, comédiens, traducteurs, vendeurs? Nul ne peut prédire l’avenir. Mais bonne nouvelle, un prototype de clonage vocal est actuellement testé chez des patients ayant perdu l’usage de la parole après l’ablation d’une tumeur.       

  

Chez les personnes souffrant d’Alzheimer, qui reconnaissent la voix d’un proche jusqu’à la fin, la voix synthétique pourrait remplacer celle d’un conjoint absent. Comme quoi ces avancées artificielles génèrent aussi des bienfaits très réels.