Prothèses vocalo-linguistiques
(c) The Golden Mouth,
Old Bond Street,
Londres

Les LLM traduisent. Ils traduisent avec une fluidité qui est étonnante et admirable. Mais avez-vous déjà regardé avec attention ce que produisent les mêmes LLM quand on leur demande de déflouter une photo ? Le résultat, ici aussi, est extraordinaire, doublement extraordinaire : d’abord parce que, le plus souvent, il est très convaincant ; et ensuite et surtout parce que, toujours, par construction, il est totalement inventé : déflouter, c’est créer de l’information (de la précision, des détails, des pixels) là où il n’y en avait pas. C’est ainsi que sur ce visage qui n’était à l’origine qu’une tache blanchâtre surmontée de cheveux apparaissent des yeux, une bouche, un sourire, une expression, une barbe ou des boucles d’oreilles, et que ces détails peuvent changer radicalement d’une itération à l’autre.

Sans doute la traduction d’un texte ou d’un propos est-elle plus contrainte que l’invention de traits, d’une physionomie, là où il n’y avait rien. Mais dans les deux processus, les LLM mettent en oeuvre et à profit leur capacité majeure, celle qui rend leur production si étrangement convaincante, cette capacité consistant à contextualiser, à utiliser toute l’information dont elles disposent pour avoir une approche prédictive et proposer quelque chose qui soit le plus cohérent possible avec ce qui précède. Dans les deux cas, l’impression de fluidité (et paradoxalement de naturel) vient ou est accrue du fait que ce qui est proposé correspond peu ou prou à ce qui est attendu ou statistiquement espéré compte tenu à la fois du contexte, et des milliards d’exemples de situations, de dialogues pu d’images vaguement comparables que le LLM a pu compulser pendant son entraînement.

Très souvent, le résultat est juste, parce qu’il existe une sorte de structuration interne du langage, de génie de la langue, mais aussi de conformité du monde à la vérité, qui fait que ce qui est attendu est souvent conforme à la réalité. Il y a, comme dans la matière et l’antimatière au sein de l’univers, un équilibre général du langage entre le vrai et le faux, une presque égalité de ces deux substances ; mais comme dans le cosmos, il existe, au sein de cet équilibre global, une asymétrie initiale et fondamentale, une sorte de singularité linguistique originelle qui fait que le vrai l’emporte et que les mots disent plus souvent le vrai qu’ils ne disent le faux. C’est pourquoi nous avons une tendance naturelle à croire ce qu’on nous dit, à le croire « sur parole » ; et c’est pourquoi aussi les LLM, quand ils ne font que poursuivre les mots précédents, tombent le plus souvent juste.

Le plus souvent, mais pas absolument toujours. Et encore moins lorsque ce qu’il faudrait générer, ou traduire, sort des sentiers battus, du statistiquement attendu.


Aldor

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.