Biais de ChatGPT à la lumière de Don Quichotte . . .
J'ai redécouvert avec plaisir Don Quichotte, une œuvre de mon enfance, grâce au podcast éclairé 'Un été avec Don Quichotte' de William Marx sur France Inter. J'invite à une réflexion sur le phénomène du biais de ChatGPT, à la lumière de l'épisode du 28 juillet 2023, intitulé 'Où l'on doute de la réalité.'
ChatGPT et perception : Entre données et illusions de Don Quichotte
Dans l'univers romanesque de Miguel de Cervantes, Don Quichotte incarne le chevalier égaré dans les méandres de son imagination. Les simples moulins à vent se muent en colosses menaçants, un barbier devient chevalier, et un banal plat à barbe s'élève au rang de heaume précieux. Marx, dans son analyse, le souligne avec acuité : "Don Quichotte transforme cet âne en noble destrier, ce barbier en fier chevalier, ce vulgaire métal en or précieux, ce plat à barbe en un heaume légendaire – rien de moins que celui arraché au roi Mambrin par le vaillant Renaud de Montauban."
ChatGPT par une analogie éloquente, se construit et se déforme à travers les prismes des données qu'elle traite. Les systèmes d'apprentissage machine, gorgés de données massives (plus de 200 milliards de paramètres de ChatGPT), façonnent leurs modèles à partir de ces influx d'informations. À l'instar de Don Quichotte percevant des ennemis là où ne se dressent que des moulins, ChatGPT discerne tendances, prédictions et liens, là où l'humain ne voit que des faits et des nombres. Cette interprétation singulière de la réalité s'avère un terreau fertile pour les biais potentiels.
Biais de ChatGPT : Dans le sillage de Don Quichotte numérique
Le défi des préjugés inhérents de ChatGPT s'ancre profondément dans la qualité des données qui la nourrissent. Tel Don Quichotte, le chevalier de Cervantes, qui interprète le monde selon sa vision personnelle et son imagination débordante, ChatGPT se forge et s'éduque à travers le spectre des données qu'elle reçoit. Lorsque ces informations sont erronées, partiales ou incomplètes, ChatGPT à son tour, adopte et reproduit ces mêmes inclinaisons dans ses analyses et ses générations.
Marx, dans son exploration podcastique, met en exergue comment la réalité perçue par Don Quichotte est façonnée par ses choix de croyance et de perception. De façon similaire, ChatGPT sélectionne des modèles dans les données, suivant les orientations et les limites imposées par son apprentissage. Elle peut ainsi accentuer certaines tendances tout en en délaissant d'autres, révélant ainsi les contours de sa propre 'réalité' algorithmique.
Et maintenant ... biaisées or not biaisées ?
Comme le souligne Luc Julia, co-inventeur de Siri et expert en IA, un algorithme est alimenté par des données recueillies sur Internet, qui peuvent parfois être erronées ou tout simplement fausses (tout ce qu'on trouve sur Internet n'est pas vrai ?!). Il aborde également le problème des "hallucinations" où ChatGPT génère des résultats qui n'ont aucun sens ou qui sont déconnectés de la réalité. Cela est dû au fait que les systèmes d'IA sont conçus pour fournir une réponse à tout prix, même lorsque l'information recherchée est introuvable. Dans de tels cas, ChatGPT "improvise" une réponse basée sur des statistiques ou des suppositions, ce qui conduit à ce que l'on appelle une "hallucination."
Dans le même ordre d'idées, les sources anglophones sont surreprésentées dans les différents modèles, au détriment de régions comme l'Afrique, ce qui peut entraîner des biais culturels.
La qualité des données est souvent à l'origine des différents biais dans ChatGPT. Mais qui a l'autorité pour déterminer la véracité de certaines informations ? Prenons l'exemple des affirmations non vérifiées et des théories du complot propagées par un certain Donald, ancien président de la première puissance mondiale. Ces déclarations ont été largement diffusées en ligne, mais qui doit décider de leur véracité ? La réponse à cette question soulève des problèmes complexes d'éthique, de responsabilité et de gouvernance.
Et si on enchaînait sur un thème fétiche de Donald...
Fake News vs Vérité : Don vs Donald
Dans l'univers fictif de Don Quichotte, la frontière entre réalité et fiction est floue et sujette à interprétation. Le chevalier, accompagné de son fidèle Sancho Panza, s'immerge dans des débats philosophiques sur la nature de la réalité, souvent teintés d'humour. Toutefois, au cœur de ces échanges se dissimule une interrogation : quelles conséquences entraîne une perception de la réalité influencée par des informations erronées ou trompeuses ? Les "fake news", ces nouvelles fallacieuses, disséminent des convictions et des idéologies parfois radicalement éloignées de la réalité objective. Ce phénomène prend une ampleur particulière lorsqu'il est amplifié par des personnalités d'influence et relayé par certains médias, brouillant ainsi le discernement entre la vérité et le mensonge. Cette quête de vérité, emblématique de Don Quichotte, trouve un écho particulièrement pertinent dans notre ère actuelle, marquée par une surabondance d'informations et une désinformation rampante.
La démocratie de ChatGPT : un vote sur la réalité
Dans l'odyssée de Don Quichotte, Cervantes illustre comment la réalité peut être façonnée par la majorité. Marx, dans son analyse perspicace, interroge cette idée de réalité définie collectivement. Un épisode marquant du roman met en scène un vote organisé par les compagnons de Don Quichotte pour trancher si un objet est un heaume de légende ou un simple plat à barbe. Le consensus est clair et unanime : il s'agit d'un heaume. Marx s'interroge : "Un épisode fascinant. Peut-on vraiment établir la réalité par un consensus, comme dans un processus démocratique ?"
Cette réflexion trouve un écho dans les dilemmes contemporains liés à ChatGPT. Peut-on vraiment définir la réalité à travers un consensus algorithmique ? Les prédictions de ChatGPT, lorsqu'elles sont adoptées par la majorité, deviennent-elles notre réalité partagée ? Que se passe-t-il lorsque ces prédictions s'appuient sur des données biaisées ou non représentatives ? Et que dire des contenus générés automatiquement par des systèmes comme AutoGPT, sans aucune intervention humaine pour vérifier leur validité, contenus qui influencent ensuite les modèles de ChatGPT (pollution numérique) ?
Du chevalier aux "Illuminati"
Marx, dans son analyse approfondie, trace un parallèle saisissant entre la perception altérée de la réalité de Don Quichotte et les théories du complot modernes. Il observe : "Remplacez l'‘enchanteur’ de Don Quichotte par des entités comme les ‘Illuminati’ ou la ‘CIA’, et vous obtenez le socle des thèses conspirationnistes actuelles." Lorsqu'elle est mal orientée ou mal interprétée, ChatGPT peut effectivement nourrir de telles théories. Les algorithmes, manipulables, peuvent renforcer des préjugés ou diffuser des informations erronées. Ces distorsions de la réalité, similaires aux illusions de Don Quichotte, peuvent s'avérer aussi ridicules qu'elles sont dangereuses.
Conclusion du centaure : De la quête du chevalier errant au ChatGPT halluciné
Entre Don Quichotte et ChatGPT, on a un sacré duo ! Cervantes nous montre que la réalité est un puzzle façonné par nos croyances, nos fantasmes, et, soyons honnêtes, nos biais bien humains. Don Quichotte voyait des géants là où il n’y avait que des moulins à vent ; ChatGPT, lui, voit des tendances là où il n’y a parfois que du vent (et beaucoup de bruit de données).
Alors oui, ChatGPT est une bête de calcul, un vrai centaure numérique. Mais comme le chevalier errant, il n’est pas infaillible, surtout quand il se nourrit de données biaisées. Et si nous voulons éviter de finir en Sancho Panza de l'IA, il est temps d’affûter notre sens critique et de ne pas avaler tout ce que l’algorithme nous sert sur un plateau doré de "fake news".
Alors, prêts à affronter les moulins à vent de la désinformation avec un bon coup de lance... et une dose de scepticisme bien affûtée ?
Podcast : Où l’on doute de la réalité (radiofrance.fr)
Échos authentiques de Don Quichotte à ChatGPT
I "La vérité s'amincit, mais ne se brise jamais, et elle flotte toujours au-dessus du mensonge, comme l'huile sur l'eau." ⚖️
— Don Quichotte, Livre II, Chapitre 32
Cette phrase souligne la persistance de la vérité, même face à des données biaisées ou incorrectes. Un rappel que l’IA peut se tromper, mais que la vérité, elle, finit toujours par se dévoiler.
I "La liberté, Sancho, est un des dons les plus précieux que les cieux aient faits aux hommes." 🕊️
— Don Quichotte, Livre II, Chapitre 58
Un écho pertinent à la question des biais et des choix dans les algorithmes : la liberté de perception et d’interprétation est primordiale, tant pour l’homme que pour les intelligences artificielles.
I "Moi, je sais qui je suis", répondit Don Quichotte. 🛡️
— Don Quichotte, Livre I, Chapitre 5
Cette affirmation montre la conviction de Don Quichotte dans sa propre perception de la réalité. Comme ChatGPT, qui "pense" connaître la vérité à partir de ses données, cette certitude peut être fausse si la réalité est déformée par des biais.
I "Les choses de la guerre sont, plus que toutes les autres, sujettes à un perpétuel changement." ⚔️
— Don Quichotte, Livre II, Chapitre 18
Ce constat sur l’instabilité du monde fait écho à l’évolution rapide des informations traitées par l’IA, où les données sont constamment mises à jour, influençant la "réalité" perçue par les algorithmes.
🎯 Envie d’aller plus loin ?
Dernière mise à jour : 17 octobre 2024