Les IA cas, faux con
====================

Date: 2025-08-13 15:02
Author: jdn06
Category: Divers
Tags: IA

Comme beaucoup, j'imagine, je suis déjà passé  par  plusieurs  phases
dans mes jugements péremptoires sur  ce  qu'est  devenu  l'IA  depuis
l'apparition des [grands modèles de langage (LLM). Essayons  donc  de
décrire mon évolution à ce sujet, en espérant que je  pourrai  relire
cet article dans  quelques  années  sans  avoir  trop  à  en  rougir.

C'EST FORMIDABLE

Ma  première réaction  fut assez enthousiaste : ne  suivant  pas  les
développements technologiques dans ce domaine, je ne m'attendais  pas
à ce qu'il soit possible de sitôt de converser ainsi  librement  avec
une machine, en obtenant  des  réponses  crédibles.  Pourtant, en  y
réfléchissant aujourd'hui, je me dis que les progrès remarquables  de
la  traduction  automatique   dans   les   années   qui  précédaient,
annonçaient clairement une révolution à venir dans la  production  de
textes. Je commençai par passer un peu de temps à jouer avec et à  en
parler autour de moi, assez surpris  de  ne  trouver  souvent  qu'une
indifférence  polie,  voire  parfois  une  hostilité  immédiate :  le
développement d'une IA textuelle  semblait  d'emblée  menaçante  pour
certains  —  qui  n'avaient  pas  forcément  tort  en  prévoyant  des
impacts sociaux très rapides et pas forcément désirables.

C'EST NUL

Vint ensuite une phase  de déception relative et  de  critique. D'une
part,  en  tant   qu'enseignant   de   lettres,   toute   utilisation
professionnelle de l'IA pour me faire gagner du temps  (rédaction  de
cours ou d'exercices de grammaire) était limitée par la  pauvreté  du
rendu et les nombreuses  erreurs  et  absurdités  engendrées.  Je  me
souviens  par  exemple   que  ChatGPT  ne  se  trompait  jamais   sur
l'orthographe d'un  accord, mais  était  capable de  citer  une règle
impliquant un accord qui contredisait son  choix  orthographique.  Il
pouvait par exemple écrire « ils se sont dit » tout en expliquant que
dans  cet  exemple  avec l'auxiliaire  être  il fallait  accorder  le
participe passé avec le sujet  du  verbe.  Comme  toujours  dans  ces
cas-là, il s'excusait quand on lui en faisait la  remarque,  tout  en
recommençant de plus belle.

Sur un plan  plus  créatif, il était aussi  très facile aussi  de  le
prendre en faute. Si on essayait de lui faire écrire  un  sonnet,  le
sens était à peu près correct, mais il lui était impossible de ne pas
faire d'erreur concernant les rimes ; quant à leur disposition et  au
mètre…  Si  on  essayait  de  lui  faire  résumer  un  livre,  on  se
retrouvait avec quelque chose d'à la  fois  vague,  très  partiel  et
faux :  des personnages inventés, le récit limité au  début  du livre
etc. Bref, c'était épatant pour quelqu'un qui ne  maîtrisait  pas  le
sujet, moins pour les autres.

Pour ce que j'en comprenais par ailleurs,  il  était  difficile  pour
ceux qui mettaient en place ces technologies de  comprendre  pourquoi
le modèle  ne  fonctionnait   pas  correctement.  Les  réponses étant
fondées  sur  l'utilisation  statistique  d'un  corpus  d'une  taille
inhumaine,  difficile  de  comprendre   comment se  fabriquaient  les
hallucinations.

Les  impacts  négatifs   de  cette  technologie  furent  aussi  assez
immédiats  concernant l'attitude des  élèves  face  au  travail à  la
maison. Certains rendaient des exercices  d'application  d'un  cours,
sans  mention de ce cours,  mais  en  produisant  des  réponses aussi
longues que vagues et creuses. Évidemment, interrogés à ce sujet, ils
étaient incapables d'expliquer le sens de ce  qu'ils  avaient  écrit.
Les  exposés  étaient   aussi   parfois très   baroques,   avec   des
développements sans rapport avec le sujet et  des  élèves  incapables
d'expliquer ce que cette partie faisait là.

Quand enfin, je voulais résoudre  un  problème de  programmation  en
Python ou en LaTeX, l'amateur que je suis ne trouvait pas grand chose
d'intéressant dans les réponses de ChatGPT. Il proposait en  gros  de
faire les choses  entièrement différemment,  et non  de  corriger  le
problème   de  mon  code,  qu'il  était en  général  bien   incapable
d'expliquer.

Quand on mettait ceci en parallèle avec les investissements entrepris
et l'impact environnemental de ces technologies, on  ne  pouvait  que
rester dubitatif et sceptique. Étais-je donc le seul à considérer que
cela ne marchait pas vraiment ?

Par  ailleurs, certains ingénieurs,  comme  Luc  Julia,  expliquaient
qu'il était à craindre que la qualité des productions des IA ne fasse
qu'empirer  quand  le  corpus  qu'elles utiliseront  sera  en  partie
composé de textes déjà produits par IA, du fait  de  la  présence  de
plus en plus  marquée de textes produits par IA sur  le  web.  En  se
nourrissant  de ses  propres  productions,  elle  s'éloignera  encore
davantage du modèle humain souhaité.

C'EST QUAND MÊME BIEN UTILE

Puis  arrive  le  mois  de  juillet  2025.  J'ai  quelques  problèmes
informatiques à régler, qui  m'ennuient  parfois  depuis  longtemps :
routage IPv6 de mon modem-routeur, connectivité  parfois  défaillante
au redémarrage d'un de mes serveurs, utilisation de rspamd pour gérer
DKIM, erreur  de compilation LaTeX de  certains tableaux  depuis  une
mise à jour du paquet tabularray. Comme on  m'a  conseillé  d'essayer
Perplexity, et que je profite des vacances pour essayer de régler ces
problèmes, j'interroge Perplexity quand je ne trouve pas de  solution
sur le web.  Et là, le résultat est parfois un peu  humiliant ! Alors
que je viens de passer deux heures à lire de la documentation et  des
blogs pour mettre en place le DKIM dans rspamd, une simple question à
Perplexity m'apporte la solution instantanément. Du coup, je me  mets
à l'interroger  concernant les autres problèmes à régler et  le bilan
est  très largement  positif. Utilisé  comme  un moteur de  recherche
amélioré, l'outil est  particulièrement  performant :  il  permet  de
compiler et de résumer l'ensemble des informations disponibles sur le
web et fait gagner  beaucoup de temps. De plus, il  permet  aussi  de
gagner en assurance : on a  moins  tendance  à  se  dire  qu'on a  pu
négliger une partie du problème qu'on ne connaît pas ou à laquelle on
n'a pas pensé. Les procédures de vérification permettent de faire  le
tour des problèmes connus, avec une certaine certitude : par exemple,
si le modem est bien configuré de telle  et  telle  manière,  que  le
serveur a bien tel ou tel port ouvert et que  nous  pouvons  vérifier
qu'aucun paquet n'arrive jusqu'au serveur grâce  à  telle  procédure,
alors le problème ne vient probablement pas  de  chez  moi.  Le  fait
qu'il cite tous les sites consultés pour préparer sa  réponse  permet
d'aller plus loin et de mieux comprendre la situation.

Dans  la vie quotidienne, son  utilisation  peut  aussi permettre  de
gagner du temps. J'arrivais cette semaine dans un petit village de la
Meuse où je me mets au vert chaque mois d'août. Or cette  année,  les
routes  sont  défoncées  par  de  larges  tranchées  et  les  maisons
couvertes de poussière.  Interrogé,  Perplexity  m'explique  aussitôt
qu'il  s'agit de travaux  de  collecte  des  eaux  usées,  liés à  la
construction d'une station d'épuration et que les travaux vont encore
durer quelques semaines. Il cite les différents  documents  officiels
qui annoncent ces  travaux.  J'aurais  certainement  pu  trouver  une
réponse grâce à un moteur de recherche, mais la démarche  aurait  été
beaucoup  plus laborieuse,  car les  liens  renvoyés  par  le  moteur
n'auraient pas tous été pertinents, loin de là.

Je reste en revanche très perplexe devant les erreurs  grossières  du
logiciel :

-   l'outil peut tout  à  fait demander  d'utiliser  une  option  qui
   n'existe pas pour la commande  utilisée,  sous  prétexte  qu'elle
   existe pour une autre commande sous une autre plateforme ;
-   il m'a demandé  d'installer et de configurer  unbound sur FreeBSD
   puis  a donné  des instructions  pour lancer  local_unbound; j'ai
   imaginé   qu'il  s'agissait d'un  des   lanceurs   possibles   de
   l'application, alors qu'en fait c'est un programme disponible par
   défaut (donc qui ne s'installe  pas)  et  dont  les  fichiers  de
   configuration  sont situés  ailleurs.  Beaucoup  de temps  perdu,
   puisque  mes modifications de  la  configuration  n'avaient aucun
   impact sur le programme lancé — et pour cause…
-   il peut se tromper  en inversant une adresse IPv6 pour le reverse
   DNS : le début et la fin sont  corrects,  mais  les  chiffres  du
   milieu sont trop nombreux, et inversés par deux. Comme je n'avais
   pas  vérifié en détails, cette erreur m'a fait  perdre  une bonne
   heure !

Bref, un outil qui fait gagner du temps dans certains cas, si on  est
assez vigilant pour ne pas en perdre…