Génération IA
Posts
Comment je me suis créé un deuxième cerveau avec l'IA

Comment je me suis créé un deuxième cerveau avec l'IA

Transformez le chaos informationnel en connaissances actionnables grâce à un deuxième cerveau IA alimenté avec vos données. Bienvenue dans le monde du RAG avec l'outil génial d'une jeune startup française.

Benoit Raphael, Flint GPT & Thomas Mahier
21st janvier 2024

Bonjour !

Ce matin, on va commencer par un mot compliqué. Oui, je sais. Mais attends.

Dans quelques secondes tu vas te dire : mais pourquoi il me dérange un dimanche matin pour me parler d’un truc hyper technique ?

Eh bien détrompe toi.

Ce mot va te paraître horrible, mais c’est c’est comme un “klug” aux marrons. Tu sais, la patisserie de M. Preskovic dans le “Père Noël est une ordure”. C’est moche, on ne sait pas ce qu’il y a dedans, c’est difficile à avaler, mais après tu me remercieras. Hum… enfin j’espère.

Oh, c’est une buche ? Non c’est Klug.

Je suis Benoît Raphaël et si tu ouvres cette lettre pour la première fois, je me présente : je suis le co-fondateur de Génération IA. Ici, on explore ensemble le monde complexe de l’intelligence artificielle de façon pédagogique, pratique et… critique.

Dans cette lettre tu vas :

→ Découvrir pourquoi le RAG est le mot à connaître en 2024.

→ Créer ton premier RAG en quelques secondes et te doter d’un second cerveau super utile. Et ce, grâce à une boîte française 🇫🇷.

→ Apprendre à créer des fiches de lecture avec l’IA.

→ Savoir si ça vaut le coup de dépenser 22€ par mois pour bénéficier de l’IA dans Word et Powerpoint. Mmmh…

→ Découvrir un livre que nous avons co-écrit avec l’IA.

→ Te demander si on peut vraiment se dire artiste quand on fait faire ses images par l’IA.

→ Voter et laisser tes commentaires pour nous aider à améliorer cette lettre.

Bonne lecture !

Ce mot indigeste, c’est le “RAG”. Ça veut dire, accroche toi, “Retrieval Augmented Generation”. Non, il n’y a pas de traduction possible en français.

Thomas, qui t’expliquera un peu plus bas ce qui se cache techniquement derrière ce mystérieux acronyme, propose “génération augmentée par de la recherche”. En gros, pour te la faire courte, c’est un ChatGPT qui écrit du texte mais à partir d’une documentation que tu lui fournis. Et ça change beaucoup de choses. Tout d’abord ça peut règler en partie le problème des hallucinations (ChatGPT se trompe 4 fois sur 10 dans ses réponses). Tiens par exemple, puisque je sais que tu vas me poser la question, j’ai demandé à une IA associée à un RAG “C’est quoi au fait l’étude qui dit que ChatGPT se trompe 4 fois sur 10 ?” et il m’a donné le bon lien vers l’étude.

Laisse-moi t’expliquer comment ça marche.

Et vas voir que ça va révolutionner ta façon de travailler et de penser. Ou tout simplement te permettre de te souvenir ENFIN des informations que tu vois passer chaque jour sur ton écran.

Pour bien comprendre, il faut déjà savoir comment ChatGPT et ses amis gèrent les informations dont ils disposent dans leur base de connaissance. Les grands modèles de language (comme GPT-3.5 ou GPT-4) sur lesquels ces outils d’IA s’appuient ont été entrainés sur des milliards de données textuelles issus de pages web, de livres, d’articles Wikipédia et de médias. Quand tu poses une question au modèle, on dit qu’il va “rêver” la réponse, c’est à dire générer un texte qui tente de répondre en faisant la meilleure moyenne de tout ce qu’il a ingurgité autour de ce qu’il a compris de ta question. Il ne va pas chercher l’info, il la reconsitue.

Et c’est comme ça qu’il se trompe parfois. C’est ce qu’on appelle les hallucinations. Ce n’est pas un bug, c’est inhérent à la technologie qui est derrière ChatGPT. Pour limiter ce problème, on rajoute une deuxième couche d’entrainement (qu’on appelle le “fine-tuning”) où des humains (ou d’autres robots) vont lui dire : “ta réponse est fausse, coco” ou “ta réponse est merveilleuse, mon ami”. Mais ça ne marche pas toujours.

Ça va ? Tu suis ? Ok, je continue.

Le RAG c’est donc une méthode complémentaire qui permet de dire à l’IA : “Bon écoute ChatGPT, en fait, on ne va pas s’appuyer sur tes connaissances. Je vais plutôt te donner ma bibliothèque et on va aller chercher dedans ensemble. C’est pas que je ne te fais pas confiance, hein, mais bon ce travail est trop important pour que je prenne des risques, ok ?”

Thomas a dessiné un joli schéma pour que tu comprennes comment marche un RAG.

Bon, à ce stade, tu vas me dire : “Ok, c’est intéressant en théorie, merci, mais concrètement ça veut dire quoi ? Je sais pas faire du RAG moi.”

Eh bien en fait, c’est très simple. Quand tu demandes à un outil d’IA de lire un long document en PDF, la plupart du temps, c’est déjà du RAG.

Et à un niveau plus élaboré, tu peux mettre à disposition de ton chatbot une base de données des meilleurs vins, la documentation complète de ton entreprise, tes pensées philosophiques éparpillées dans ton journal intime, tes notes de lecture, ou le dernier powerpoint rigolo que t’a envoyé tonton Jules. Je vais te montrer.

Les fameux GPTs par exemple, ces mini ChatGPT que tu peux personnaliser pour des tâches précises dans la version payante, et dont on a beaucoup parlé ces derniers mois, c’est du RAG lorsque tu leur associes une documentaion. Mais en version simplifiée.

En gros, avec le RAG, le modèle de language utilise ses connaissances pour analyser et pour écrire, et va chercher dans les connaissances que tu lui donnes pour exploiter les bonnes infos dans sa rédaction. Comme ça tout le monde est content. Et ça règle 90% des problèmes que l’on rencontre avec ces outils d’IA.

Mais on peut faire encore mieux.

Tu peux utiliser le RAG et l’IA pour te fabriquer un deuxième cerveau.

Je me suis intéressé au deuxième cerveau il y a un an et demi, lorsque je travaillais sur mon livre “Information: l’indigestion”. J’avais compris que le problème de surcharge informationnelle que presque tout le monde subit de nos jours ne venait pas tant de la surabondance d’infos que de sa redondance, son inutilité, et surtout du fait que nous oublions presque tout ce que nous lisons. Notre cerveau surnage à la surface de la connaissance tout en nous faisant croire qu’il sait. Tu connais sans doute cette sensation : lorsque tu discutes d’un sujet avec quelqu’un et que tu dis “j’ai lu un article super intéressant là dessus”. Et là on te demande “Ah bon, et ça dit quoi ?” “Euh, alors je ne me souviens plus trop, mais c’était super intéressant, euh, attends, je demande à Google”. Et là Google te propose 40 liens. Le temps qu’on perd à retrouver dans notre cerveau ce qu’on a lu et oublié… c’est parfois à se demander si lire sert à quelque chose.

Le concept de deuxième cerveau a été rendu célèbre par Tiago Forte, dans son livre “Construire un deuxième cerveau”. L’idée est de se constituer un système de notes qui permet de stocker et de retrouver tout ce que l’on a appris pour le réutiliser plus facilement dans le futur mais aussi de les combiner pour générer des idées nouvelles.

J’ai donc suivi sa méthode et j’ai commencé à créer mon deuxième cerveau. J’ai utilisé un outil génial pour ça : Notion. Il te permet non seulement de noter tout ce que tu veux, mais surtout il le transforme en base de données. Voici comment j’ai fait.

Je crée un compte sur Notion (c’est gratuit), puis je clique sur créer une nouvelle page. Et dans la page je choisis “ajouter table”. Ce qui ne veut pas dire que je mets une table dans la page, mais que je vais pouvoir ajouter une nouvelle base de données.

A partir de là, je commence à structurer ma base dans le tableau : la note que je prends, un tag pour le ranger dans un thème, la date etc. Aujourd’hui, ça ressemble à ça :

Il y a beaucoup de liens vers des articles et des études, mais aussi des pensées ou des idées qui me viennent, des outils que je trouve intéressants, des extraits de livres que j’ai lu. Comme je suis très paresseux, j’ai une extension chrome qui me permet d’enregistrer automatiquement les articles que je trouve intéressants, et Notion dispose d’une IA (dans la version payante) qui me le résume en français. Et quand j’ai une idée qui me vient sous la douche, je l’enregistre à haute voix sur mon mobile avec l’IA d’Audiopen qui transforme mes pensées confuses en texte cohérent.

En un an, j’ai entré 1824 notes dans mon deuxième cerveau.

Bon, le problème avec un deuxième cerveau comme ça, c’est : comment je retrouve la bonne connaissance ? Et, surtout : comment je la transforme en quelque chose d’utile (par exemple une nouvelle note qui combine plusieurs idées ou plus simplement un article inspiré) ?

C’est là que le RAG intervient.

L’idée est de brancher ta base de connaissance personnelle sur une IA générative. Alors ça ne marche pas avec ChatGPT parce que le dossier est trop lourd. Il me fallait trouver une autre solution.

Tout d’abord, depuis quelques mois, Notion propose une fonctionnalité géniale de RAG qui te permet d’interroger un chatbot d’IA sur ta base de données. Il suffit de prendre un forfait “Plus” à 8$ par mois pour y accéder. Tu cliques sur le petit ✨ en bas à droite et tu poses n’importe quelle question au chatbot qui va te retrouver les notes correspondantes et te faire une synthèse. Ce petit truc tout bête a changé ma vie.

Tu es toujours là ? Bien. Maintenant on va passer un cran au dessus !

Depuis un an, les solutions de RAG ont fleuri un peu partout, mais toutes sont assez complexes (ou très coûteuses) à mettre en place.

Et puis j’ai découvert une startup française qui a eu l’idée géniale de proposer un RAG pour tous, super facile à installer (en moins de 5 minutes) et surtout à utiliser. Une sorte de ChatGPT sous stéroïdes. Qui te permet de stocker toutes les bases de données et documents que tu veux, et de faire travailler GPT-4 dessus (c’est à dire le modèle de ChatGPT), mais aussi… ses concurrents.

La plateforme s’appelle Dust. Je joue avec depuis plus d’une semaine et plus j’explore ses fonctionnalités, plus je suis excité.

Dust se connecte avec ton Notion ou un Google Drive par exemple. Mais tu peux aussi stocker n’importe quel fichier dans un dossier : un powperpoint, un document word, un PDF, une base de données…

Tu choisis ensuite ton modèle d’IA. Tu as le choix entre GPT-4, Claude (le concurrent survolté de ChatGPT, inaccessible en France), le modèle français et open-source “Mixtral”(par Mistral) et même Google Gemini Pro. Mais c’est GPT-4 qui marche le mieux.

Pour cela, il faut créer un assistant. C’est comme un GPT. C’est à dire un petit chatbot personnalisé, rien que pour toi, à qui tu vas enseigner une méthodologie, un style, une rigueur, une personnalité si tu veux.

Tu peux lui poser des questions bien sûr, mais tu peux aussi lui demander de t’écrire un article de synthèse sur un sujet qui t’intéresse. Et il écrit l’article en pointant à chaque fois vers chacune de tes notes, que tu peux ainsi retrouver et consulter.

Précision importante : Dust est une jeune startup française, elle respecte donc autant que se peut les règles européennes sur la confidentialité des données. Tous tes documents sont cryptés.

A côté de ton second cerveau, tu peux créer des mini-cerveaux sur des documentations spécifiques. J’ai par exemple créé un robot sommelier que je fais parler en anglais mais avec un style français inimitable. Je suis allé chercher ses données sur un site hyper utile, Kaggle. Tu peux télécharger des bases de données gratuites sur à peu près tout, comme par exemple une liste des vins de tous les pays avec leur description.

J’ai aussi créé un petit assistant IA pour un client. Un groupe média que j’accompagne dans le lancement d’un nouveau média sur l’environnement et qui me demande régulièrement des rapports avec des formats différents selon qu’il doit être lu par la grande patronne ou par un collaborateur. J’ai stocké toute la doc dans un dossier et je peux produire des rapports en quelques secondes… “Euh Benoit, tu pourrais m’envoyer une nouvelle note sur la stragégie de lancement ?” Moi : “Ok, je t’envoie ça d’ici une minute”. Haha. Le génie français.

Alors qu’en 2023 plein de gens se demandaient si ChatGPT n’allait pas nous remplacer ou (au choix) nous rendre plus idiots, mon intuition est que, en 2024, avec le RAG, nous allons tous pouvoir être augmentés d’un deuxième cerveau IA qui va nous rendre plus intelligent.

La seule chose à laquelle il va falloir faire attention, c’est de prendre soin de notre base de connaissance, mieux la structurer, l’alimenter, la nettoyer et la protéger. Comme un jardin intérieur.

Voilà !

Je ne peux pas résister à te montrer la photo de mon nouveau copain sommelier (réalisée avec l’IA de Midjourney) et je te souhaite un bon RAG pour le déjeuner.

Pour aller plus loin : comprendre le RAG avec un chatbot sur le climat

Thomas Potter

Si tu as envie de comprendre en profondeur la technologie qui se cache derrrière le RAG, Thomas Mahier (qui est ingénieur en IA et mon associé chez Flint) s’est transformé en professeur fou pour décortiquer avec toi les mystères de l’IA.

👉️ Découvre son article ici. C’est écrit très simplement et avec humour !

Créer des fiches de lecture avec l’IA : ça marche ou pas ?

Voici un autre exemple de RAG, encore plus simple : la recherche sur Internet avec l’IA. Tu vas voir que ça peut être aussi très utile, par exemple pour synthétiser l’essence d’un livre.

Lire des livres ça prend du temps, et même si je lis beaucoup, j’ai toujours rêvé de pouvoir avoir une synthèse que je puisse conserver avec moi et puisse me servir de référence.

J’utilise Copilot, c’est le chatbot gratuit de Microsoft qui embarque GPT-4 dans son moteur de recherche.

Voici comment je fais. Je règle Copilot sur la fonction “Plus précis” (impératif : les autres réglages poussent le modèle à interpréter et donc à inventer).

Voici mon instruction (prompt) :

Agis comme un expert en livres non fiction, rédacteur de fiches de lecture très denses. Tu as un PhD en littérature et une vaste expérience dans l'analyse de livres de divers genres. Tu es reconnu pour ta capacité à condenser des informations complexes en fiches de lecture claires et informatives. Tu as rédigé plus de 500 fiches de lecture qui ont été utilisées par des étudiants et des chercheurs, et tes résumés sont régulièrement cités comme ressources de référence dans le domaine de la littérature non fiction.  

Tu fonctionnes comme un système de Retrieval Augmented Generation (RAG), sauf que ta documentation est Internet.  

Lorsque je te demanderais la fiche d'un livre, tu feras des recherches approfondies et synthétiseras ce livre sous forme de fiche de lecture détaillée.  

###Format :  
Utilise ce format  pour ta fiche :   
- Cinq parties, cinq recherches :  
1) Qui est l'auteur ? 
2) De quoi parle le livre ? 
3) Problèmes posés  
4) Solutions ou idées proposées  
5) Un exemple concret  

###Contraintes :  
- Définis et explique les concepts propres élaborés par l'auteur, en particulier dans les solutions, et donne toujours des exemples. 
- Si tu ne trouves pas les informations dans tes recherches, fais une nouvelle recherche.  
- Si tu n'as pas d'informations, dis que tu ne disposes pas assez d'informations pour remplir cette partie de la fiche.   

Voici le livre sur lequel tu vas travailler étape par étape : ["TITRE" - AUTEUR]

Essaie avec ces 6 livres essentiels sur l’IA :

“Quand la machine apprend” - Yann Le Cun
“L’intelligence artificielle n’existe pas” - Luc Julia
“Le mythe de la singularité” - Jean-Gabriel Ganascia
“The Coming Wave” - Mustafa Suleyman
“Atlas of AI” - Kate Crawford
“AI Superpowers” - Kai Fu Lee

J’ai essayé avec “A la recherche du Temps Perdu”, mais Copilot m’a répondu : “Désolé mais Marcel Proust ne propose pas de solutions à ses problèmes.” Haha, sacré Marcel.

Comment ça marche ? Pour réaliser sa fiche, Copilot est allé chercher sur Internet sa documentation. Il est allé voir sur le site du livre et a consulté plusieurs articles sur le livre. Il n’a pas “lu” le livre lui-même. Sa synthèse est imparfaite (parce que sa recherche l’est), mais comme il a pour instruction de me prévenir s’il n’a pas assez d’infos, j’ai moins de risque qu’il hallucine. C’est le problème que tu peux rencontrer, par exemple, lorsque tu demandes à ChatGPT. Il s’appuie sur ses connaissances (les livres qu’il a dans sa base) mais les réinterprète, avec un risque assez important de confabulation.

Cinq outils utiles et un autre moins

A propos de Copilot, ça va t’intéresser si tu utilises Word ou Powerpoint : Microsoft a enfin sorti son concurrent de ChatGPT+, en version payante à 22€/mois. Verdict ? Pas mieux. Mais surtout, Copilot Pro (c’est son petit nom) s’intègre aussi dans la suite 365 (Word, Powerpoint, Excel, Outlook…). Et il est enfin accessible aux particuliers. Est-ce que ça vaut la peine ? Je n’ai pas été convaincu. Mais tu auras peut-être un autre avis.

👉️ Mon retour d’expérience est ici.

Et si tu en as marre que je te parle d’outils payants. J’ai aussi compilé une petite liste d’outils gratuits que j’utilise régulièrement pour faire des images ou des recherches :

Les 5 outils d'IA gratuits à connaître en 2024

Perplexity, Microsoft Designer, Leonardo... de nouveaux acteurs proposent des solutions d'IA gratuites aux stars de l'IA comme ChatGPT. Petit tour d'horizon des challengers.

generationia.flint.media/p/top-5-outils-ia-gratuits

Un livre écrit par une IA

Le contenu de ce livre est passionnant, mais la façon dont il a été écrit l’est plus encore. Il y a quelques mois, Denis Lafay, journaliste à la Tribune, nous a lancé un défi : écrire un livre avec l’IA.

Le challenge : synthétiser la richesse d’une journée de tables-rondes avec des personnalités autour de questions d’époque (IA, démocratie, jeunesse, art…) et d’en faire un contenu au niveau des exigences d’une belle maison d’édition : les éditions de l’Aube.

Avec Thomas on a bossé une semaine. Première étape : transformer les vidéos des tables rondes en un texte exploitable. On a utilisé l’IA de Noota (boîte française) pour ça.

Le transcript a ensuite été traité par Claude 2 (le concurrent de ChatGPT qui peut traiter de plus grands textes avec moins de biais de style), avec un prompt travaillé spécifiquement pour donner un style narratif agréable à lire sans perdre la profondeur des échanges.

Le texte a ensuite été soumis brut à la sagacité des correcteurs des éditions de l’Aube qui ont corrigé les incohérences, parfois quelques inventions. Leurs corrections ont été ajoutées dans le livre, ce qui rend sa lecture encore plus passionnante !

Le livre contient aussi un chapitre dans lequel je décris tout notre process, et propose une réflexion sur les défis posés par l’IA à la créativité humaine.

👉️ “DemocratIA” est disponible dès aujourd’hui aux Editions de l’Aube.

L’image qui retourne le cerveau

Est-ce qu’on est un ariste lorsque nos oeuvres sont générées par l’IA ? La question n’a pas fini d’enflammer les débats. Mais la question est-elle bien posée ? L’outil doit-il définir l’artiste ? Sans doute est-on artiste quel que soit l’outil qu’on utilise. Pour alimenter ta réflexion, je te propose de découvrir les oeuvres du collectif singapourien “Nice Aunties”, qui produit des vidéos très étranges… Elles ont été exposé dans le musée d’art contemporain POCO en Estonie.

GM GE!
‘Inner Cornflakes’
Every full moon triggers aunties’ inner cornflakes (conflicts) but they were quickly processed and digested.
Thank you for your support in 2023,
Wishing you beautiful intentions for 2024. 💛
— niceaunties (@niceaunties)
3:58 PM • Dec 29, 2023

On construit cette lettre ensemble !

La dernière lettre a suscité beaucoup de votes positifs, merci !

🟩🟩🟩🟩🟩🟩 Top ! (233)

⬜️⬜️⬜️⬜️⬜️⬜️ Bien mais... (26)

⬜️⬜️⬜️⬜️⬜️⬜️ Bof... (3)

Jean-Charles a trouvé que c’était la “meilleure lettre”, et nous parle de son livre “Conversation avec une IA” (que tu peux trouver ici).

C’est pour moi la meilleure lettre depuis que je vous lis. Plus informative que les précédentes qui jusque là n’amenaient pour moi pas grand chose de plus que “The Neuron” ou autre lettres du même style. Cela laisse présager une belle année 2024 😀 L’article sur l’intelligence artificielle était très intéressant. Je partage votre définition sur “l’ensemble de technologies qui nécessiteraient habituellement l’intelligence humaine”. À ce sujet j’ai écrit un livre “Conversation avec une IA” qui parle entres autres des différentes formes d’intelligences et d’IAs. (désolé pour cette pub perso 😉)

Parmi les critiques, Julien aurait aimé plus de surprises :

Je sais pas, je trouve qu'il manque cette semaine le petit côté "coucou voici des choses dont tu n'as pas idée mais qui existent". Je pense que comme tu nous avais teasé l'influenceuse sur le groupe WhatsApp, ça m'a moins surpris. (Pis il manque un nouvel article de Thomas !) 😃

Le “groupe WhatsApp” auquel Julien fait référence est un groupe d’entraide ouvert aux abonnés qui ont acheté l’une de mes deux formations à ChatGPT et à l’art du prompt. Si tu n’as pas encore osé franchir le pas, je te propose de nous rejoindre avec une réduction exceptionnelle, réservée aux abonnés de Génération IA, de 30% (10 places disponibles).

Voilà ! A toi de voter !

Comment as-tu trouvé cette lettre ? Vote ici et laisse tes commentaires pour nous aider à nous améliorer ! Dis moi aussi ce que tu aimerais voir en plus ou en moins.

Comment as-tu trouvé cette édition ?

Et laisse un commentaire pour nous aider à améliorer la prochaine lettre !

Connexion ou S'abonner pour participer aux sondages.

Merci de nous avoir consacré un peu de ton temps. Je te souhaite un bon dimanche ! Pense à passer au musée !

🖼️ Benoît, Thomas et FlintGPT.