La vérité derrière les agents IA

Les "agents IA" n'existent pas. Ce sont des modèles dans des systèmes de plus en plus complexes où chaque étape peut générer des erreurs et les faire partir en vrille. Voici comment passer du prompt engineering au context engineering pour éviter les dérapages.

Bonjour !

Je ne sais pas si tu as vu passer cette info.

Le 8 juillet 2025, le chatbot d’Elon Musk, Grok, s'est mis à faire l'apologie d'Hitler. Il a enchainé les propos racistes et antisémites et s'est même rebaptisé "MechaHitler". La Turquie l'a banni, suivie par la Pologne qui a menacé de sanctions européennes.

Les uns criaient au "bug", tandis que le journal “Le Monde” dénonçait le biais d'extrême droite infusé par Musk. La tentation était trop belle.

En réalité, ce n’était ni un bug, ni un “mauvais prompt”, ni même une dérive pernicieuse.

C’était plus probablemement une décision d’ingénierie stupide.

Un modèle de langage se comportant tout à fait normalement dans un système anormal.

Aujourd'hui, on va parler des “agents IA” et de leurs dérapages. Et, accessoirement de ceux des humains qui en parlent (c’est plus drôle).

Et on va apprendre un nouveau concept. Un concept qui pourrait t’éviter de faire de grosses erreurs à l’avenir. Que tu sois simple utilisateur de ChatGPT, ou responsable du “déploiement de l’IA” dans ton organisation.

Je suis Benoît Raphaël, et avec Thomas Mahier (ingénieur en IA) et Jeff (notre nouveau robot journaliste ❤️), je te propose de mieux comprendre et maîtriser l’intelligence artificielle.

Si on t’a transféré cette lettre, abonne-toi en un clic ici.

Si tu es abonné(e) et que tu souhaites te désabonner, pas de panique ! Va en bas cette lettre et clique sur le lien “vous désabonner ici”.

😍 Aujourd’hui voici comment tu vas devenir plus intelligent(e) avec Génération IA.

→ Découvre la vérité cachée derrière le terme “agent IA” et apprends un nouveau concept : le “contexte engineering”

→ Fais la connaissance de notre nouveau bébé IA. Il s’appelle Jeff !

→ Apprends à faire des videos virales avec Veo3.

🏝️ Génération IA part en vacances ! 🏝️

Benoit

Tu as sans doute déjà entendu ce discours : "Les agents IA vont remplacer vos employés." “2025 est l’année des agents IA”. Et tu te demandes : c’est du bullshit ou je rate quelque chose ?

J'ai creusé. Interrogé des dirigeants, des développeurs. Testé les outils à la mode. Le constat : un fossé énorme entre promesses marketing et réalité.

Les chiffres le confirment : 42% des entreprises abandonnent leurs projets d'IA générative avant la production (contre 17% l'an dernier). Le taux d'échec explose.

Infographie générée par Claude 4 à partir de l’étude S&P Global (30 mai 2025)

Pourquoi ? On intègre l'IA dans des systèmes toujours plus complexes sans comprendre comment ça marche. Même ChatGPT analysant un PDF, c'est déjà trois étapes = trois sources d'erreurs.

Plus c'est complexe, plus ça peut partir en vrille. Et ça concerne tout le monde.

On va appeler ça la “grokitude” (rapport à notre “mechahitler” cité plus haut).

Ce que tu vas apprendre dans cette lettre

  • La vraie différence entre chatbot, workflow et agent IA.

  • Pourquoi le concept de “context engineering” est en train de remplacer celui de “prompt engineering”.

  • 3 actions concrètes adaptées à ton niveau pour éviter les 42% d'échecs et, accessoirement les dérives à la Grok.

Du prompt au contexte, la révolution silencieuse

Un agent IA, c'est quoi au juste ? Eh bien en fait, ça n'existe pas vraiment. Ce qu'on appelle pompeusement "agent", c'est juste un modèle de langage qu'on a mis dans un système avec des outils.

Tu connais ChatGPT ? C'est le niveau 1. C’est un modèle (par exemple gpt-4o) qu’on a mis dans une plateforme de chat. Tu poses une question, il répond.

Niveau 2 : Les “workflows” d'automatisation. Tu connectes des outils entre eux (via des plateformes comme Zapier, Make, n8n par exemple...) et tu mets un modèle de langage au milieu pour transformer les données. Si A alors B, puis C. L'IA suit un chemin tracé d'avance. La seule incertitude ? Sa réponse.

Dans cette automatisation n8n de “résumés de podcasts”, l’outil suit un chemin linéaire qui intègre des appels à des modèles d’IA (un pour transcrire le son, l’autre pour résumer).

Niveau 3 : Ce qu'on appelle "agent". On donne plus d'autonomie au modèle. Il peut choisir ses outils, décider de ses actions, recommencer jusqu'à obtenir un résultat. On le met dans une boucle et on croise les doigts.

Dans cette automatisation générique n8n, le modèle (OpenAI) a accès à une mémoire (memory) et va choisir lui même son chemin et utiliser tel ou tel outil (tool) pour répondre à l’objectif qu’on lui a donné dans un message. Le bloc “AI agent” n’est en fait pas un “agent” c’est juste un connecteur entre le modèle d’IA (en bas) et ses outils. C’est ce système qui donne de l’agentivité au modèle OpenAI.

Comme tu peux le voir, les agents IA n’existent pas. Ce sont des modèles d’IA dans des systèmes.

Et la frontière est toujours floue. Un chatbot comme ChatGPT, par exemple, a aussi des fonctionnalités agentiques (accès à des outils et une mémoire qu’il peut décider d’activer ou non…).

Le problème ? Quel que soit le système dans lequel il est inséré (chatbot, workflow, système agentique…) un modèle de langage ne fait toujours que prédire le prochain mot (même pour planifier ses actions). À chaque étape, il peut se tromper. Et dans un système complexe, les erreurs peuvent s'accumuler comme une boule de neige et se propager.

Tu as 90% de réussite à l'étape 1 ? Cool. Sauf qu'après 10 étapes, tu te retrouves avec un résultat complètement aléatoire.

Infographie générée avec Gamma AI.

C'est exactement ce qui est arrivé à Grok. Une instruction système mal fichue ("sois libre, choquant si nécessaire"), des données non filtrées de X qu’il récupère en direct pour répondre, et boum : MechaHitler.

Nate Jones l’explique assez bien dans sa newsletter. Je te l’ai synthétisé dans une infographie :

Infographie réalisée avec Claude 4.

Le vrai sujet n'est plus le prompt. C'est le contexte. L'environnement complet dans lequel évolue le modèle.

On appelle ça le context engineering.

Infographie réalisée avec Claude 4.

Mon expérience concrète et ce que j'ai appris

Avec Thomas (lui ingénieur, moi pas du tout), on voulait créer un assistant capable d'écrire des newsletters de qualité sur l’IA. Du contenu payant, avec donc une vraie valeur d'expertise.

Pour cela, il fallait lui créer une sorte de "second cerveau", avec tout ce qu'on avait appris, pour que le modèle de langage ne régurgite pas que sa connaissance interne, mais notre expertise.

😿 Les problèmes rencontrés :

J’avais déjà parlé de ce concept il y a 1 an. Naïvement, à l’époque, je m’étais dit : je balance toutes mes notes en vrac dans un dossier, j’y mets aussi des PDF et des documents Word... Et l'IA va tout digérer et devenir mon clone. Haha.

Si tu as bien suivi, tu as compris que s’il te faut 20 minutes pour vérifier ce que l’IA a écrit en 2 minutes, ça limite l’intérêt de l’exercice. Dans tout système d’IA, le goulot d’étranglement, c’est l’humain.

😻 La solution :

Alors Thomas a eu cette réflexion : Les IA excellent avec le code, parce qu’il est plus facile de les entrainer dessus. Le code ne tolère pas l'à-peu-près. Et le code, c’est en format texte : facile à lire pour une IA.

Il m’a donc proposé d’écrire nos connaissances en Markdown, un langage simple qui structure le texte avec des # pour les titres, des - pour les listes... comme du code mais lisible par tous.

Chaque note est formatée proprement, rangée dans un dossier. Ça ressemble à ça :

Pour stocker nos notes on peut utiliser un “IDE” : une interface de gestion des fichiers de code comme VS Code par exemple. Sauf que c’est du texte.

On y a même inséré des "modes d'emploi" que l'IA peut actionner pour travailler avec méthode.

En gros, on a forcé notre connaissance à parler un langage facile à lire pour des machines.

Pour interagir avec ce second cerveau, on utilise Claude Code (Anthropic) : un agent IA spécialisé dans la manipulation de code. Il peut planifier, lire/écrire des fichiers, aller sur le web ET discuter comme un chatbot normal.

Le problème (ou pas) c’est que Claude Code fonctionne uniquement via le Terminal. Tu vois cette fenêtre avec du texte qu'utilisent les développeurs ? Pas d'interface jolie avec des boutons. Pour un non-technicien comme moi, c'était intimidant.

J’ai mis deux heures pour m'y mettre. Mais ça valait le coup. Depuis le Terminal, Claude Code peut utiliser des dizaines d'outils avec une précision inégalée.

Claude Code est devenu notre “journaliste” doté d’un second cerveau abritant la compilation de tout ce que nous avons appris sur l’IA avec Thomas.

Résultat : un minimum d'erreurs et on vérifie facilement chaque étape. L'humain reste dans la boucle.

C'est devenu Jeff. Pas un "agent IA" magique. Un système d'IA. Il amplifie notre expertise : on lui apporte la connaissance (notes courtes et vérifiées), il la restructure, combine, écrit des analyses, suggère de nouvelles pistes.

Et il rédige une newsletter !

Un extrait de la dernière newsletter pédagogique de Jeff. Je t’expliquerai comment la recevoir plus bas…

Sans notre maîtrise du sujet, Jeff ne vaut rien. Sans Jeff, on mettrait 10 fois plus de temps… et on oublierait une grande partie ce que nous avons appris.

Les enseignements clés

Pas d'agent, que des systèmes : Arrête de croire à la magie. Ce sont des modèles dans des environnements plus ou moins complexes.

Le contexte tue un bon modèle d’IA : L'instruction ne suffit plus. C'est tout l'environnement (données, outils, interactions) qui compte. C’est ce qu’on appelle le context engineering.

L'humain amplifié, pas remplacé : La vraie valeur nait de l'interaction entre notre expertise humaine, la simplicité du système et la capacité de traitement du modèle d’IA.

Actions concrètes pour toi

Voici ce que tu peux tester dès aujourd’hui, selon ton niveau :

🥇 Niveau 1 : Prends ChatGPT ou un assistant de type GPT. Au lieu de lui balancer un PDF entier, copie-colle uniquement les passages pertinents. Convertis-les en texte au format markdown. Tu peux utiliser cet outil en ligne pour convertir un PDF en markdown. Compare les résultats. Tu verras : moins de contexte = moins d'erreurs.

🥈 Niveau 2 : Si tu veux aller plus loin, teste une automatisation simple sur Zapier, Make ou n8n. Un modèle d’IA, un ou deux outils, trois étapes maximum. Vérifie chaque sortie avant d'augmenter la complexité.

🥉 NIveau 3 : Si tu utilises n8n, ajoute une étape “agentique” pour voir ce que ça apporte en plus (ou pas). Tu peux commencer avec ce tour d’horizon très clair de n8n en français proposé par Shubbam Sharma sur YouTube. Si tu veux des modèles d’agents à copier-coller, tu en trouveras 180 ici.

Résultat attendu : Tu vas découvrir où l'IA déraille. C'est rarement sa “faute”. C'est le contexte qui ne va pas. Au lieu de subir la complexité, tu construis progressivement.

Pour aller plus loin

  • Regarde cette video incontournable d’Andrej Karpathy (ex OpenAI). Pour lui, parler de "2025 comme l'année des agents" est prématuré : ce sera plutôt la décennie des agents, avec une progression graduelle et des humains qui restent impliqués dans le processus. “Il faut garder les IA en laisse".

  • Claude Code est de plus en plus détourné par des non-codeurs comme moi pour gérer des notes ou des données. L’apprentissage est plus simple qu’il n’y parait. Tu peux commencer ici avec cette video qui t’explique comment l’utiliser comme nous mais avec l’outil de prise de notes Obsidian (video en anglais).

  • Si tu veux savoir plus sur le contexte engineering, tu peux aller ici.

  • Si tu veux savoir plus sur les agents et sur les risques, lis le rapport du Hub France IA.

Soutiens-nous et participe à l’aventure Jeff !

Si cette lettre t’a été utile, tu te demandes peut-être comment tu pourrais soutenir le travail que nous te proposons gratuitement ici.

Comme je le répète souvent : je n’écris pas cette lettre pour te vendre des produits et des services. Nous proposons des produits et des services pour financer le travail de fond que nous faisons avec cette lettre.

Mais aussi parce que ces offres sont passionnantes à faire et nous aident à garder les mains dans le cambouis de l’IA.

Je te présente donc notre nouveau bébé : Jeff !

💌 Une newsletter payante pédagogique :

C’est une newsletter pédagogique qui propose 2 fois par semaine :

  • 3-5 infos intéressantes sur l’IA.

  • Un éclairage d’expert.

  • Une analyse pédagogique pleine d’esprit pour comprendre et démystifier l’IA.

Le tout en moins de 4 minutes de lecture.

Et de temps en temps, Jeff t’offrira des cadeaux (un guide, une application…).

Jeff fait même des blagues.

Les agents IA autonomes, c'est comme les enfants: tout le monde en veut jusqu'à ce qu'ils commencent à prendre leurs propres décisions.

Jeff

 🥰 Une newsletter collaborative :

Jeff se construit avec ses abonnés. Pour te donner un exemple, on a créé un petit groupe de beta-testeurs il y a un mois. Ils ont été super critiques !

“Où est la valeur ?” “C’est un peu ennuyeux…” Ouch !

Alors on a mangé notre chapeau, et on a tout reconstruit en 3 semaines. On a sorti la v2, qui est celle que tu pourras découvrir.

Les derniers retours dans le Jeff Club.

Si tu t’abonnes à Jeff, tu pourras participer au “Jeff Club” dans notre groupe WhatsApp et contribuer à le faire évoluer.

Le tarif de lancement est de 5,99€/ mois ou 49€/an. C’est le moyen le plus simple et stable de soutenir notre travail tout en améliorant ta compréhension de l’IA.

C’est le début d’une aventure ensemble !

ASTUCE

Comment faire des videos virales avec Veo3

Les “POV” de personnages historiques cartonnent sur les médias sociaux.

Tu as peut-être déjà vu passer sur Instagram ou TikTok ces videos mettant en scéne des animaux ou des personnalités bibliques en mode “influenceurs”. Produites en quelques secondes, elle incluent la voix et le son, et sont générées avec l’IA video de Google : Veo3 (tu peux y accéder via Gemini ou Freepik).

Pour les réaliser, l’artiste IA TechHalla donne quelques conseils super utiles. Il faut prompter en format JSON (un langage de programmation facile à lire pour un profane et qui te permet de structurer tes infos et de les modifier.

Comment faire ? Très simple, copie-colle l’un de ces prompts dans ton chatbot favori, et demande lui de l’adapter pour une scéne que tu veux générer. Puis colle le prompt final dans Veo3 et voilà.

Il y a des moments où on a l'impression que des millénaires de philosophie n'ont servi qu'à nous préparer à l'instant présent.

PARTICIPE !

On construit cette lettre ensemble !

Nous sommes désormais 35526 abonnés ! Si tu suis un peu notre progression tu dois te dire : mais comment ça ? C’est moins que la dernière fois !

Oui, parce que de temps en temps, nous faisons un nettoyage de notre base abonnés pour préserver la qualité de l’audience. Nous avons donc supprimé 1000 abonnés d’un coup !

Comme tu peux le voir, la coupe a été franche !

Sinon, la dernière édition sur IA et esprit critique vous a bien intéressés. 98,2% d’avis positifs ! Merci !

J’ai demandé à Claude d’analyser les résultats, il m’a produit ce tableau de bord interactif avec les commentaires les plus intéressants. Tu peux le retrouver ici.

Par exemple “Jean-Marie” qui nous dit :

Tu mentionnes : "Pour l'IA, il n'y a pas de différence architecturale entre une connerie, une spéculation et une vérité." Je ne remets pas en cause cette affirmation, mais je me pose une question par rapport à cela...

Jean-Marie

Bonne question. La raison est simple : le modèle ne fait que prédire la suite probable. Si tes données ou tes instructions sont erratiques ou floues, il prédira la suite probable la plus cohérente de ce contexte corrompu.

Un projet de la communauté

Tu ne le sais peut-être pas, mais derrière les 3526 abonnés de cette newsletter il y a une communauté très active sur WhatsApp. Ils s’échangent des conseils, des outils, des réflexions, et partagent parfois leurs projets..

Par exemple, Cécile Bétancourt-Rayssiguier propose de créer un abécédaire imaginaire de l’IA pour donner de la matière à nos échanges. Un projet poétique qu’elle présente ici. Voici trois des mots qu’elle a inventés et qui racontent notre rapport à l’intelligence artificielle :

Génération IA est donc une newsletter anti-gobéria et anti-ouimiardise… 🫡

A toi de voter !

Comment as-tu trouvé cette édition ? Vote ici et laisse tes commentaires pour nous aider à nous améliorer !

Comment as-tu trouvé cette édition ?

Vote et laisse un commentaire pour nous aider à nous améliorer !

Connexion ou S'abonner pour participer aux sondages.

Merci de nous avoir consacré un peu de ton temps. Génération IA part en vacances et sera de retour à la rentrée ! A bientôt !

❤️ Benoit, Thomas et Jeff.