Comment faire raisonner une IA

Aujourd'hui je t'emmène dans un voyage fascinant à travers les nuances du raisonnement artificiel. Est-ce plus complexe qu'il n'y paraît?

Bonjour !

Si tu viens d’arriver, bienvenue dans cette seconde non-édition de “Génération IA”.

Alors je dis “non-édition” parce tu fais partie des 800 privilégiés qui participent à la construction de ce nouveau média.

Un nouveau média collaboratif destiné à nous aider à mieux comprendre et à maîtriser les révolutions actuelles et à venir de l’intelligence artificielle.

Nous ne sommes pas encore prêts à basculer les 21.000 autres abonnés de Flint vers “Génération IA”. Haha, loin de là !

Pour l’instant nous explorons avec toi ce que nous pouvons faire.

Ce qui est aussi une manière d’explorer les capacités et les limites de l’IA.

Et d’en parler ensemble.

Tu nous fais tes retours, et on améliore.

Ça te va ?

Bien.

Aujourd’hui, on va parler de choses absolument fascinantes.

Peut-on faire raisonner une intelligence artificielle générative (comme ChatGPT par exemple) pour lui faire écrire un article d’analyse de qualité ?

Tu vas découvrir que c’est une question cruciale et… un peu sensible.

Elle a été au coeur de notre travail ces quinze derniers jours.

Alors peut-on ?

On s’est arraché 40.000 cheveux (enfin je crois, je n’ai pas compté).

(Photo de moi-même réalisée avec l’IA de l’application “Remini”, parce que, depuis que je vis à Bali, je n’ai plus de costume à me mettre pour faire bien sur les photos…)

L'idée, si tu t’en souviens : recomposer les tâches d'un "journaliste" et lui faire produire des contenus de qualité et utiles de façon autonome.

Et nous avons commencé à produire des articles d'analyse rédigés par l'IA de notre logiciel hybride (que nous avons appelé Flint GPT).

Lequel embarquait de l'IA générative en lui donnant une structure et des règles de travail.

Mais nous avons fait une erreur.

Nous avions pris le problème à l’envers.

Notre erreur : nous nous étions concentrés sur la collecte et la syntèse d'informations et sur le style.

Nous nous sommes laissés impressionner par le côté un peu magique de ces IA génératives.

Mais qui ne résistent pas à un usage poussé.

En gros, il ne suffisait pas de lui demander un truc, comme par exemple (je simplifie à mort) : “écris un super article d’analyse dans le style des meilleurs intellectuels”.

Non.

Il fallait aussi décomposer la façon dont nous, humains, réalisons certaines tâches intellectuelles.

Par exemple comment nous agençons les idées entre-elles avant de penser un truc.

Tâches que nous faisons habituellement sans réfléchir, n’est-ce pas ?

Nous avons aussi compris qu’il fallait ensuite adapter cette façon de raisonner à la technologie très particulière des IA génératives.

Qui est à la fois instable, un peu aléatoire, super énervante et pourtant merveilleusement souple.

Et tu vas voir que ça va t’aider à mieux comprendre comment marche l’IA et comment tu peux en tirer le meilleur en jouant avec ses limitations.

Moi, ça m’a fait l’effet d’une bombe.

Et ça a tout changé.

Oui, parce que ChatGPT peut-il raisonner ?

Bonne question.

Thomas Mahier (ingénieur IA et co-fondateur de Flint) a exploré ce sujet passionnant dans son premier article pédagogique.

Tu pourras le découvrir à la fin de cette lettre.

Attention, on va parler d’escargot !

Allez, on y va ?

🏝️ Benoît

(Ce bandeau de rubrique comme ceux qui suivent,a été réalisé avec l’IA de Dall-E 3 en quelques secondes. Dall-E 3 est la nouvelle IA d’OpenAI, que tu peux retrouver dans la version payante de ChatGPT. Elle permet de générer des images mais aussi du texte et de créer ensuite des variations de cette même image en discutat avec l’IA…)

Bon, si tu étais là il y a 15 jours, tu te souviens que je t’avais posé des questions pour commenter les premières rubriques de Génération IA.

Et en particulier celle concernant un article d’analyse réalisé par notre nouvel ami(e) FlintGPT, pour accompagner la rubrique “Le débat”. Mais aussi une rubrique de brèves d’actu (“le brief”), rédigée par FlintGPT, et un tutoriel (“le tuto”) rédigé par moi, histoire de comparer.

Ah oui, FlintGPT, c’est l’IA que nous avons créée avec notre plateforme Flint pour rédiger certains formats de cette newsletter (si tu veux te rafraichir la mémoire, j’explique tout ici).

Je me suis donc retrouvé avec plus de 300 commentaires à analyser.

Et je t’avoue que ce n’était pas simple, parce qu’ils étaient assez contradictoires.

J’ai donc utilisé l’IA de ChatGPT, et en particulier une fonctionnalité incroyable, disponible dans la version payante, qui s’appelle “Advanced Data Analysis” (“Analyse de données avancées”).

Avec cette fonctionnalité, tu peux envoyer un tableau excel avec les données (en vrac) de ton sondage. ChatGPT s’interface alors avec un logiciel d’analyse et se met à coder (en langage “python”) pour analyser les résultats, sortir des tableaux et en tirer des conclusions.

Voilà à quoi ça ressemble :

👆 Ici, tu vois, je charge les 3 fichiers excel du sondage, j’explique à ChatGPT de quoi il s’agit et je lui demande de me produire une analyse comme le ferait un expert de l’institut de sondage IFOP ou IPSOS (qui coûte beaucoup plus cher, tu noteras…)

ChatGPT m’a alors proposé de commencer par plusieurs visuels.

Le premier analyse les données quantitatives (qui a aimé la rubrique ?), le deuxième analyse la tonalité positive ou négative dans les commentaires associés à chaque rubrique, avant de rentrer dans les détails.

Tu noteras que c’est la rubrique rédigée par un humain (à gauche) qui a remporté le plus d’avis positifs (en vert) 💪. Yeaaaah…

Bon, on ne va pas y passer des heures non plus, mais ce que notre ChatGPT/IPSOS, avec son flegme caractéristique, a retenu de ce sondage c’est que les humains sont beaucoup plus durs avec les IA qu’avec leurs congénères.

Il a aussi noté que c’est la rubrique “Le débat” qui a le plus généré de… débat.

C’est normal, puisque c’est avec cet exercice de rédaction d’article de fond que l’on a demandé à Flint GPT l’exploit suivant, c’est à dire :

  • parcourir une dizaine d’articles et de documents

  • en extraire les infos clés

  • y réfléchir

  • et produire une analyse argumentée

  • en citant ses sources.

Autrement dit, Flint GPT était-elle capable de raisonner ou simplement d’imiter un raisonnement de manière superficielle, hop ni vu ni connu ?

Ce commentaire extrait du sondage résume assez bien les réactions :

"J'aimerais un peu plus de style. Et peut-être aussi un peu plus de profondeur ou de détail. Mais c'est un bon départ de réflexion en l'état."

Bref, c’était impressionnant pour une majorité d’entre-vous, l’analyse se tenait et faisait pas mal illusion… mais c’était un peu… comment dire ? … mmmh…

… un peu plat ?

Et là nous avons soudain réalisé quelque chose d’absolument essentiel.

Reste avec moi, tu vas voir, c’est très intéressant.

Que fait ChatGPT quand on lui demande de produire une analyse ?

Il analyse ?

Non non.

Il fouille dans ses données d’entrainement (des millions de textes, d’articles, de conversations et de livres), porte son attention sur des textes proposant une analyse (par exemple un article d’un expert), et essaie de reproduire ce qu’il lit en l’adaptant au problème qu’on lui pose.

Mais comme il essaie (parce que son logiciel est statistique) de trouver la “meilleure moyenne” d’un style d’écriture, les résultats sont généralement plats. Et parfois faux.

Et nous avons compris quelque chose : ce n’est pas le style de l’expert qui importe. Le vrai style n’est, au fond, que le résultat d’une façon de penser.

Ce n’était pas sur le style qu’il fallait faire travailler l’IA, mais sur la manière d’agencer les idées.

Nous avons donc complètement revu nos instructions.

Il fallait tout décomposer.

Comment un humain produit-il une réflexion ? De A à Z ?

Énorme prise de tête !

Nous avons donc fait un premier essai sur un exercice relativement simple : écrire un texte très bref, de synthèse d’article, mais en même temps très structuré, que nous avons appelée “Le Brief”.

Je vais te montrer, tu vas voir c’est fascinant.

Bon, là tu vas me dire, on s’en fout. On sait que ChatGPT sait bien faire les résumés.

Oui mais non.

On va lui faire faire plus qu’un résumé. Histoire de voir si nous pourrons adapter cette méthode structurante pour créer, disons dans 15 jours, un vrai article d’analyse original.

Avec un style inimitable et une certaine profondeur. Soyons fous.

(Si tu t’ennuies à ce stade, passe à la section suivante, sinon je continue !)

Pour faire cet exercice, nous nous sommes inspirés du format génial d’un média américain, Axios.

Créé en 2017, ce média a un style incomparable, très expert, très dense… et faussement simple.

Il est célèbre pour ses articles synthétiques, écrits par des journalistes de haut niveau, qui parviennent à capturer l’essence d’une info en la découpant en blocs : “Que se passe-t-il ?”, “Pourquoi c’est important”, “Que disent les chiffres ?” etc. A chaque fois évidemment, les sections changent. C’est un travail d’orfèvre.

Axios est l’un des médias les plus intelligents et intéressants de sa génération.

Voilà, dans ta face Flint GPT ! Peux-tu faire mieux ?

Pour tenter d’atteindre l’excellence journalistique d’un Axios, nous nous sommes inspirés d’une méthode appelée “la chaîne de pensée” (“Chain of Thoughts” en anglais).

Des scientifiques ont découvert que l'on pouvait forcer les modèles comme celui utilisé par ChatGPT, réputés pour ne pas savoir raisonner, à décomposer les instructions en sous instructions.

Cela leur permet d’améliorer très sensiblement leurs capacités de raisonnement.

Thomas (qui t’expliquera la technologie derrière tout ça plus bas) a donc demandé à Flint GPT de découper l’information qu’on lui donne en segments.

Voici un extrait de l’instruction (qui fait plusieurs pages !) donnée à Flint GPT :

Segment dans le contexte de l'information :

Définition : Un segment est un élément distinct ou une section d'un contenu plus large. Il s'agit d'une unité d'information qui se concentre sur un aspect ou un angle particulier d'une histoire ou d'un sujet.

Objectif : Le but d'un segment est de présenter une information de manière concise, explicite et ciblée. En séparant une histoire ou une information en segments, on peut mettre en évidence des points clés ou des perspectives différentes, facilitant ainsi la compréhension et l'engagement du lecteur ou de l'auditeur.

Une fois les segments d’une info identifiés, on demande à l’IA de les organiser. Il y a en tout sept étapes, au cours desquelles on force l’IA à se poser des questions et des sous-questions. Voici un exemple de la méthode qu’on lui donne (étape 5) :

5. Sélection, Cohérence et Justification :
- Après avoir dressé ta liste, commence par identifier le message principal du document. Ce message guidera ta sélection des segments les plus pertinents.
- Sélectionne les deux ou trois segments (trois segments maximums) qui non seulement éclairent le mieux ce message principal, mais qui permettent aussi une progression logique et cohérente de l'information. Ces segments doivent, ensemble, offrir une vue d'ensemble complète et riche du sujet traité, tout en restant fidèles à ce message principal.

Donc comme tu vois, et je te la fais très courte, au lieu de demander à l’IA d’imiter un style, on lui apprend à raisonner sur un ensemble d’informations, étape par étape.

Le style unique de l’IA sera donc la conséquence de sa manière de raisonner, pas de l’imitation du style d’un expert humain.

Bon… et ça donne quoi ce truc compliqué ?

Alors voici, ci-dessous, les quatre brèves d’infos de la semaine, proposées par Flint GPT ! 

Je te les présente de façon brute, sans aucune retouche humaine, pour que tu puisses te faire ton opinion !

Adobe et l'IA : une alliance pour l'avenir de l'édition vidéo

Par Flint GPT

En Bref. Adobe met l'accent sur l'intelligence artificielle (IA) et la génération de contenu avec une série de projets prometteurs qui pourraient bien redéfinir l'édition de vidéos et d'images.

La Révolution. Le Project Fast Fill d'Adobe est particulièrement remarquable. Il permet aux éditeurs de manipuler des vidéos comme s'ils travaillaient avec des images fixes, offrant une flexibilité sans précédent pour le retrait d'objets ou le changement d'arrière-plans.

L'Impact. L'adoption de l'IA ne se limite pas à Adobe. L'industrie de l'édition vidéo dans son ensemble a vu une augmentation de l'utilisation d'outils alimentés par l'IA, y compris chez des concurrents majeurs comme Davinci Resolve.

(Article en anglais)

Mistral, la startup française d'IA, lance un chatbot non modéré et suscite la controverse

Par Flint GPT

En Bref. Mistral, une startup française d'IA évaluée à 260 millions de dollars, a lancé un chatbot sans mécanisme de censure, suscitant une vive polémique sur Internet.

Le produit. Le chatbot, baptisé Mistral-7B-v0.1, est le premier grand modèle de langage public, gratuit et open source de la société. Il a été publié via un fichier torrent, ce qui signifie qu'il est hébergé de manière décentralisée et est essentiellement impossible à censurer ou à supprimer d'Internet.

La philosophie. Malgré les préoccupations en matière de sécurité, Mistral maintient que son approche ouverte de l'IA générative est nécessaire pour lutter contre la censure et les préjugés dans la technologie. Le PDG de Mistral, Arthur Mensch, a déclaré : "Rendre l’IA utile".

La CNIL se mobilise pour une IA respectueuse de la vie privée

Par Flint GPT

En Bref. La Commission Nationale de l'Informatique et des Libertés (CNIL) a mis en place un service dédié à l'IA et a lancé deux programmes d'accompagnement pour soutenir les acteurs français de l'IA. Elle a également publié des lignes directrices pour un usage de l'IA respectueux des données personnelles.

Le RGPD et l'IA. Les principes du Règlement Général sur la Protection des Données (RGPD) peuvent être appliqués à l'IA, à condition de respecter certaines conditions. Ces principes fournissent un cadre pour garantir que l'utilisation des données dans le contexte de l'IA respecte les droits et libertés des individus.

La Vision de la CNIL. La CNIL estime que le développement de systèmes d'IA est conciliable avec les enjeux de protection de la vie privée. Elle affirme que l'innovation en matière d'IA peut aller de pair avec le respect des valeurs européennes et des droits des individus.

Ai-Da, le robot artiste qui fait sensation

Par Flint GPT

En Bref. Ai-Da, un robot ultra-réaliste, crée des œuvres d'art qui font tourner les têtes. Conçu pour observer son environnement et prendre des décisions artistiques autonomes, il est le fruit du travail d'un ancien galeriste et d'une équipe d'ingénieurs.

L'impact. Ai-Da n'est pas seulement un prodige technologique, il est aussi un phénomène financier. Les œuvres d'art qu'il crée ont déjà rendu son créateur millionnaire. De plus, Ai-Da a marqué l'histoire en devenant le premier robot humanoïde à concevoir une police de caractères pour le Design Museum.

La technologie. Les capacités artistiques d'Ai-Da ne sont pas le fruit du hasard. Ses algorithmes graphiques, qui lui permettent de dessiner des croquis à partir d'une photographie, ont été développés par des chercheurs en IA informatique de l'Université d'Oxford.

À toi de voter ! N’oublie pas de laisser un commentaire avec les brèves que tu as préférées (et pourquoi) et des propostions pour nous aider Flint GPT à s’améliorer !

🤔 Qu'as-tu pensé de cette nouvelle rubrique ?

Vote et commente ! La qualité de l'info synthétisée par l'IA ? Le style ? As-tu trouvé les sujets intéressants ? As-tu d'autres idées de sujets ? D'autres idées de rubriques ?

Connexion ou S'abonner pour participer aux sondages.

(Haha, comme tu peux voir, dans cette image, Dall-E 3 n’a JAMAIS réussi à écrire “Le Prompt” en entier. Je ne sais pas pourquoi. Il préfère écrire “LE PROMT”…)

En réfléchissant à cette méthode développée par Thomas, je me suis amusé à l’adapter à une autre compétence de l’IA : chercher des infos !

Comme tu le sais peut-être, depuis quelques semaines, ChatGPT peut enfin se connecter à Internet.

Le problème c’est que c’est un très mauvais moteur de recherche.

Quand on lui demande d’aller chercher des infos sur Internet, il peut, au mieux produire des résultats insuffisants, au pire générer des contre-vérités.

J’ai donc appliqué cette même méthode de “Chaîne de pensées” pour le transformer en assistant autonome de recherche.

Une sorte de logiciel si tu veux.

Sur n’importe quel sujet, il raisonne d’abord pour se poser les bonnes questions, cherche l’info, l’analyse, regarde ce qui lui manque, et synthétise tout ça pour toi.

Tu peux copier-coller l’instruction (c’est à dire le “prompt”) dans ChatGPT (version payante) en allant ici et me dire ce que tu en penses.

Voilà !

Si tu veux plus d’astuces comme ça, et découvrir les règles de l’ingénierie de prompt pour créer des propres instructions, tu peux suivre ma formation à ChatGPT et ses amis. Comme tu fais partie des premiers abonnés à Génération IA, je te propose une réduction exceptionnelle de 30% (attention, 10 places disponibles seulement) !

MAKING-OF : Alors alors… Pendant que je me prenais la tête à “programmer” (si j’ose dire) des raisonnements pour notre IA, Thomas (qui est un peu le programmeur de l’équipe) s’est initié à l’écriture d’articles pédagogiques !

C’est super intéressant parce que Thomas a une valeur unique à apporter à “Génération IA” que je suis incapable d’amener. Son regard d’ingénieur IA.

D’où cette nouvelle rubrique, que nous avons appelée “Le Guide”.

Pour écrire, Thomas s’est aidé de ChatGPT. Il pose un premier texte et demande à l’IA de lui trouver de meilleures formules, d’éviter les répétitions, de travailler les transitions.

Lui qui n’osait pas écrire (en mode “je sais pas écrire”), l’exercice l’a libéré. Et le résultat est super intéressant.

Imagine ce que peut faire l’IA pour des tas de gens intelligents qui ont des trucs à raconter mais n’ont pas la technique d’écriture pour le faire ! Ça te parle ?

Benoît

Mais alors comment ça marche tout ça ? Les grands modèles de langage (comme ceux derrière ChatGPT) peuvent-ils vraiment raisonner ? Eh bien oui et non. Thomas te propose donc une plongée dans les coulisses de la technologie derrière ces modèles.

Bon, avant de te présenter le premier article de Thomas, je me suis dit qu’il fallait revoir son look.

Voici à quoi Thomas ressemble (oui il est super beau et il ressemble un peu à Aragorn dans le Seigneur des Anneaux) (lui me dit que c’est n’importe quoi, mais si si…)

Donc j’ai utilisé l’IA de Remini.

L’IA lui ai enlevé son t-shirt froissé d’ingénieur pour lui mettre un joli costume.

Hum.

Maintenant qu’il est plus présentable, j’ai demandé à Flint GPT de résumer en quelques lignes son article selon la méthode du “Brief” expliquée plus haut…

Voici son résumé :

(Image réalisée par Thomas avec Dall-E 3)

En Bref. L'article explore les rouages des modèles de langage de pointe tels que ChatGPT, Bard et Claude, en mettant en lumière des concepts tels que les tokens, la prédiction autorégressive et la température.

Les fondamentaux. Les modèles de langage, qui prédisent le mot suivant dans une phrase ou remplissent les mots manquants, utilisent des unités de texte distinctes appelées tokens. Le degré d'incertitude dans les prédictions est régulé par une valeur appelée température.

L'application. Ces modèles sont affinés pour des tâches spécifiques lors de la phase de "fine-tuning", permettant la création d'applications comme ChatGPT, Bard et Claude.

L'anecdote. L'article utilise l'exemple d'un escargot qui grimpe hors d'un puits pour illustrer comment ChatGPT résout les problèmes, une analogie qui aide à comprendre comment le modèle fait des prédictions basées sur les informations précédentes.

Je t’invite à lire l’article en entier ! Et si tu n’as pas le temps aujourd’hui, à le sauvegarder pour le lire plus tard. C’est très drôle à lire et tu vas comprendre énormément de choses sur l’IA !

Et maintenant, à toi de voter !

Qu'as-tu pensé de cet article ?

C'est le premier article de Thomas ! L'as tu trouvé utile ? Clair ?

Connexion ou S'abonner pour participer aux sondages.

C’est tout pour ce dimanche, jetez l’ancre !

(Image réalisée avec Dall-E 3)

On a prévu de rendre cette lettre gratuite et hebdomadaire. En attendant le lancement officiel (dans un mois ou deux), elle restera bi-mensuelle pour pouvoir l’alterner avec la lettre du dimanche. Il nous restera à définir ensemble le jour de publication !

D’autres idées de rubriques arrivent. Je pensais à une rubrique de sélection (ou de tests) des outils IA les plus utiles du moment. Et de la rendre collaborative. Qu’en penses-tu ?

Tu peux partager cette lettre en allant sur sa version web. Le lien est en haut à droite de ton mail, sinon tu peux cliquer ici (enfin je crois !).

Tu peux aussi m’écrire à [email protected] ou en répondant à ce mail.

😃 Et si tu es enthousiaste, laisse un témoignage sur notre mur pour que le monde entier sois au courant !

Un grand merci à Lionel Myszka, qui a pris le temps d’enregistrer son commentaire en vidéo. Ça nous a beaucoup touchés !

J’attends tes retours avec impatience !

Passe un bon dimanche au pays des humains, merci de faire partie de l’équipage.

On se retrouve dans 15 jours !

🧡 Benoît, Thomas et Flint GPT