Les IA génératives ? Jorge nous en parlait déjà

☙ Posté le 22-11-2023 | ⏱ 7 minutes | ✔ 1449 mots
✎ Christophe Masutti

Les IA génératives. Sujet à la mode s’il en est. J’avoue qu’en la matière je n’y connais goutte sur le plan technique. Par contre à travers le tintamarre des médias à ce propos, on peut capter quelques bribes intéressantes et s’amuser à faire des parallèles. Ici, on va se référer au célèbre roman d’Umberto Eco, Le Nom de la Rose.

Les IA génératives c’est quoi ? ce sont des systèmes dits d’Intelligence Artificielle (cybernétiques pourrait-on dire), qui sont entraînés selon des modèles d’apprentissage sur des panels de données agrégées de différents types, les plus exhaustifs possibles, de manière à être capables de générer d’autres données. Notons que ces données sont générées à partir de ce qu’on donne « à manger » à l’entraînement. On pourra glauser sur les modèles en question, leurs puissances et leurs intérêts, toujours est-il que l’IA générative ne génère quelque chose qu’à partir de ce qu’elle connaît. Sa puissance combinatoire ne peut en aucun cas être de la même nature que notre intelligence à nous autres humains. J’arrête-là car nous entrons dans un débat philosophique qui risque de nous entraîner un peu trop loin et je voudrais, pour changer, faire un billet court.

J’ai pensé à cela lorsque j’écoutais ce matin Xavier Niel sur F. Inter, vantant son projet Kyutai, un projet de laboratoire ouvert en AI. Il parlait des IA génératives et trouvait cela géniâââl. Je le cite à peu près à 10'25 (de cette vidéo) : on agrège un maximum de données, par exemple tout ce qui s’est dit depuis 30 ans dans cette émission et quand vous allez me poser une question, je vais vous donner la meilleure réponse. Donc l’IA générative, c’est mixer des données et apporter les meilleures réponses.

C’est pas rien comme objectif tout de même. « Meilleure réponse », cela veut dire que la réponse n’est pas forcément exacte ou vraie mais qu’en l’état des connaissances disponibles on ne peut pas mieux faire. In extenso : les meilleures réponses ne s’obtiennent pas en réfléchissant à la question mais en réfléchissant à comment agréger et combiner pour générer l’information la plus pertinente. On ne s’intéresse plus aux connaisances disponibles (considérées comme un déjà-là disponible), mais aux modèles dont on choisira toujours le plus performant.

Allons plus loin, en prenant le scénario par l’absurde. Si les IA génératives apportent les meilleures réponses, on va finir par ne combiner que ces réponses. En effet, toute démarche visant à créer de la connaissance commence par distinguer les questions auxquelles on peut répondre (et vérifier) de celles qui restent sans réponse valide. Les sciences formulent des hypothèses et tentent d’en tirer des lois (grosso modo), mais si nous partons de la certitude que les meilleures réponses sont celles des IA génératives, c’est-à-dire une formulation idéale des connaissances disponibles, les hypothèses qu’un scientifique est censé émettre devront non seulement être des hypothèses plausibles au regard de ses connaissances à lui, mais aussi plausibles au regard de ce qui échapperait à l’IA générative (puisqu’elle donnerait toujours la meilleure réponse). Or, il n’y a déjà plus de place pour la conjecture puisque toute conjecture attend d’être vérifiée et il n’y a plus besoin de vérifier quoi que ce soit puisque nous avons déjà les meilleures réponses. Quand aux hypothèses, les seules qui seraient pertinentes pour l’avancement scientifique devront échapper à l’esprit humain car ce dernier, de manière à créer une hypothèse qui échapperait à la contre-hypothèse donnée par les « meilleures réponses », n’est pas capable d’agréger toutes les connaissances sur lesquelles un système d’IA peut être entraîné. De même la déductibilité à partir de ces hypothèses trouverait toujours une impossibiltié formelle si la « meilleure réponse » donne toujours tort à celui qui formule la déduction : ce qui fait un avancement scientifique, c’est un changement de paradigme, or si on reste toujours volontairement enfermé dans le même paradigme, aucune chance de révolutionner les sciences ni de faire des expérimentations cruciales (inutile puisque nous partons du principe que nous savons déjà tout ce qu’il faut savoir).

Je sais bien que je caricature et que je tire un peu trop loin les implications de l’expression « meilleure réponse ». Mais vous avez saisi l’idée générale. Pour l’avancement scientifique, l’utilisation des IA génératives nous promet de belles discussions épistémologiques. Et cela se double d’une aporie intéressante. En l’état actuel, si on part du principe exprimé par X. Niel selon lequel les IA génératives donnent les « meilleures réponses », toute IA générative devrait donc logiquement être entraînée sur la base de ces meilleures réponses pour être performantes, d’où la création de nouveaux modèles, et ainsi de suite. Si bien que les IA génératives vont finir par n’être nourries que par elles-mêmes. Bref, une gigantesque tautologie : 1=1.

Et puis, j’ai pensé au roman Le Nom de la Rose de Umberto Eco. Un ouvrage qui, chez moi, a fait tilt dans mon adolescence (je l’ai lu avant de voir le film à la TV, je n’avais rien compris, du coup je l’ai relu 3-4 fois par la suite, citations latines comprises). On y trouve ce personnage fascinant, le vénérable Jorge, doyen de l’abbaye, incarné dans le film par le magnifique Fiodor Chaliapin Jr., qui faisait vraiment peur ! À côté de lui, bouffant les pages empoisonnées du vrai-faux livre d’Aristote dans la bibliothèque à la lumière vacillante d’une bougie, les films de morts-vivants sont des blagues.

Bref, ce Jorge me fascinait, et surtout son discours qui dévoile le fin mot de l’intrigue. Pourquoi ce livre est-il interdit ? Non pas parce qu’il est censé être l’ouvrage perdu d’Aristote (le second tome de La Poétique, censé porter sur la comédie, alors que le premier porte sur la tragédie et que seule la tragédie est capable de catharsis, c’est-à-dire l’apprentissage des mœurs). Non pas parce que, portant sur la comédie, il porte sur la question du rire, propre de l’homme (même les saints hommes riaient ou avaient des situations comiques, cf. le passage du scriptorium dans le roman). Non pas enfin parce qu’il serait interdit de rire dans cette épouvantable abbaye.

Alors, pourquoi donc ? parce que le savoir authentique (la bibliothèque) n’est ni dynamique ni novateur, pour Jorge. L’important n’est pas ce qu’il y a d’écrit dans le livre, mais le fait même de vouloir chercher un livre qui n’est pas censé exister : la recherche du savoir doit se borner à ce qu’on peut tirer de la bibliothèque sous surveillance, car c’est un labyrinthe où seuls les initiés peuvent circuler et venir en retirer les bribes de savoirs jugés utiles aux simples lecteurs ou enlumineurs. Rien d’autre ne peut venir en surplus car qu’y a t-il de mieux, de plus sécurisant, que de savoir que tout le savoir est en un seul lieu et que toutes les questions y trouvent leurs réponses ? Pas de place au doute. C’est le sens de la « sublime récapitulation » dans le monologue de Jorge (cf. l’extrait ci-dessous).

Le rapport avec les IA générative ? la récapitulation. « Continue et sublime ». Voilà ce qu’est le monde des IA génératives. Elle ne sont novatrices que par leur propre nouveauté, mais elles nous mènent dans un monde où il ne peut plus y avoir d’innovation. Elles sont le reflet de ce début de siècle : nous cherchons des certitudes. Et qu’y a-t-il de plus sécurisant que de se persuader que les meilleures réponses sont dans le savoir déjà produit ?

Extrait :

« […] notre unique vraie richesse était l’observance de la règle, la prière et le travail. Mais de notre travail, du travail de notre ordre, et en particulier du travail de ce monastère fait partie – ou plutôt en est la substance – l’étude, et la garde du savoir. La garde, dis-je, pas la recherche, car le propre du savoir, chose divine, est d’être complet et défini dès le commencement, dans la perfection du verbe qui s’exprime à lui-même. La garde, dis-je, pas la recherche, car le propre du savoir, chose humaine, est d’avoir été défini et complété dans l’espace des siècles qui va de la prédication des prophètes à l’interprétation des Pères de l’Eglise. Il n’est point de progrès, il n’est point de révolution d’âges, dans les vicissitudes du savoir, mais au mieux une continue et sublime récapitulation. L’histoire de l’humanité marche d’un mouvement irrépressible depuis la création, à travers la rédemption, vers le retour du Christ triomphant, qui apparaîtra auréolé d’un nimbe pour juger les vivants et les morts, mais le savoir divin ne suit pas ce cours : immobile comme une forteresse indestructible, il nous permet, quand nous nous faisons humbles et attentifs à sa voix, de suivre, de prédire ce cours, sans en être entamé. »