- Génération IA
- Posts
- Comment l'IA vocale peut nous rendre plus intelligents
Comment l'IA vocale peut nous rendre plus intelligents
Les outils vocaux d'IA comme ceux intégrés dans NotebookLM et Dicte peuvent améliorer notre compréhension et notre rétention des connaissances.
Bonjour !
J’espère que tu vas bien !
Tiens, aujourd’hui, on va faire un podcast.
Sans micro. Et presque sans les mains. Hum…
Mais surtout, tu vas apprendre comment est-ce qu’on peut améliorer notre intelligence et notre compréhension d’un sujet complexe grâce aux outils d’IA en général… et grâce à la voix en particulier.
J’ai passé ma semaine à jouer avec cette idée. Et je suis allé de 🫣 à 🤓... en passant par 🤔. Enfin, je me comprends.
Laisse moi te raconter.
Je suis Benoît Raphaël, et avec Thomas Mahier (ingénieur en IA) et FlintGPT (robot un peu simplet mais gentil), je te propose de mieux comprendre et maîtriser l’intelligence artificielle.
Si on t’a transféré cette lettre, abonne-toi en un clic ici.
Si tu es abonné(e) et que tu souhaites te désabonner, pas de panique ! Va en bas cette lettre et clique sur le lien “vous désabonner ici”.
😍 Aujourd’hui voici comment tu vas devenir plus intelligent(e) avec Génération IA (et avec les IA vocales)
→ Découvre comment utiliser NotebookLM et pourquoi l’usage de la voix avec l’IA peut t’aider à mieux comprendre et retenir tes connaissances.
→ Apprends à générer un podcast en français à partir de n‘importe quel document pour comprendre des sujets compliqués.
→ Essaie le nouveau mode vocal de ChatGPT même si tu n’es pas aux Etats-Unis.
→ Développe ton esprit critique avec ChatGPT et Claude. Tu vas même apprendre à coder un jeu de réflexion en quelques secondes !
→ Découvre ma sélection de tutoriels et d’outils.
Il y a 15 jours, je t’avais présenté une nouvelle plateforme créée par Google qui te permettait de travailler en profondeur avec l’IA sur n’importe quel sujet à partir de documents et, surtout, de transformer ces données en un podcast plus vrai que nature. L’application s’appelle : NotebookLM.
Un gadget ? Non.
En fait, ce qui n’était, à la base, qu’une expérimentation, est peut-être le meilleur produit sorti des laboratoires de Google depuis des années.
Bon, comme tu vas certainement me le faire remarquer, tout est en anglais. Mais j’ai trouvé une parade.
Avant d’y venir, laisse moi te dire ce que j’ai découvert en utilisant cet outil.
NotebookLM est un outil de prise de notes qui entre dans la catégorie des “seconds cerveaux”. C’est un sujet qui me tient particulièrement à coeur, j’en avais longuement parlé en 2023 dans mon livre “Information : l’indigestion”.
Un second cerveau n’est pas vraiment un second cerveau. Disons que c’est un outil externe qui te permet de stocker intelligemment tout ce que tu apprends afin de pouvoir le re-exploiter à l’infini. Ça peut être un carnet de notes à spirales ou un outil d’IA.
NotebookLM s’est inspiré de la méthode PARA de Tiago Forte (le “pape” du second cerveau, qui a d’ailleurs récemment encensé NotebookLM). La plateforme propose une gestion de tes notes par “projet”. Et c’est assez malin.
Je te donne un exemple :
Pour ma newsletter sur l'IA et la créativité, j'ai créé un dossier sur NotebookLM.
J'ai d'abord enregistré des résumés vocaux de mes lectures et conversations autour du livre"Hypercréation" de Flavien Chervet. Ces notes, enregistrées et converties en texte grâce à l’application française “Dicte”, je les ai importées dans NotebookLM.
Les notes sont stockées à gauche, tandis qu’à droite de nouvelles notes sont créées avec l’IA.
J'ai ensuite interagi au clavier avec l'IA pour analyser le contenu (tu peux écrire en français, même si NotebookLM te répond en anglais).
Chaque interaction devient une nouvelle note qui vient enrichir mon dossier. Ça m’a aidé à approfondir ma compréhension du sujet (et celle de l’IA), mais aussi à identifier les zones d’ombre.
Enfin, cerise sur le second cerveau si j’ose dire (haha, je ne supporte plus mon humour), j’ai demandé à NotebookLM de générer un podcast à partir du tout. Et là, j’ai découvert un truc.
Tout d’abord, le podcast est assez époustouflant. C’est une conversation endiablée entre deux animateurs. C’est piquant, drôle, assez intello et… étonnament sans hallucinations (pas dans les usages que j’ai observés en tout cas).
Si tu cliques en haut à droite (“audio overview”) NotebookLM générera un podcast.
Mais surtout : c’est tellement bien fait qu’on n’entend pas la différence avec un podcast humain.
Je repose donc la question (que tu vas certainement me poser) : c’est pas un peu gadget ça ?
Nan. Je t’explique.
J’ai compris quatre choses dans cette histoire, et ça va t’intéresser :
Le fait de prendre des notes à partir de mon propre résumé vocal est plus efficace que retranscrire tout le livre ou l’intégralité d’une réunion par exemple. Elle évite le superflu et les erreurs de l’IA.
Le fait de créer un dossier sur la plateforme et d’échanger avec l’IA au fil de mon exploration a renforcé ma compréhension d’un sujet me poussant à compléter les zones d’ombre.
La version podcast change la donne : les animateurs IA ont un vrai talent pour transformer mon sujet en une discussion intéressante. Ça m’a aidé à identifier les éléments de débat, les points qui pourraient captiver l’attention, mais aussi l’accroche que j’allais pouvoir utiliser pour mon article.
Mieux : le podcast, avec son approche “débat grand public”, m’aide à mieux retenir les concepts.
À partir de là, je me suis amusé à créer des podcasts sur à peu près tout.
(Image générée avec Midjourney 6.1)
Là où NotebookLM excelle, c’est de prendre un article scientifique super chiant et incompréhensible, ou un livre, et de le transformer en une discussion passionnante. Et sans erreurs (à en croire les témoignages des auteurs des articles ou des livres en question, comme ici et ici avec Jeff Jarvis). J’ai trouvé que c’était une super méthode pour apprendre des trucs nouveaux.
Le seul problème tu me diras : c’est en anglais.
Oui. Je sais, le monde est cruel pour les non-anglophones.
Aors j’ai trouvé un moyen pour toi de créer tes propres podcasts en français. Je t’en parle un peu plus bas.
Pour aller plus loin :
Tu peux entrer des vidéos YouTube dans Notebook : il suffit de coller le lien d’une vidéo, et NotebookLM en fera le transcript complet et la synthèse. Tu peux aussi le faire avec un lien vers un article, un enregistrement audio ou une présentation.
Comment crée-t-on les voix avec l’IA ? J’ai demandé à Claude de me faire une infographie interactive super simple pour lister les différentes techniques. Tu peux jouer avec ici.
Découvre la newsletter de Steven Johnson, auteur de plusieurs livres et directeur éditorial de NotebookLM. Il partage ses réflexions sur le “second cerveau” et comment l’utiliser pour faire des recherches et écrire. C’est passionnant.
L’OUTIL FRANCOPHONE
Comment créer un podcast en français à partir de n’importe quel document
Il s’agit d’une plateforme open-source qui transforme n’importe quel document en conversation. Le résultat est clairement moins bon qu’avec NotebookLM. Les voix me font penser à une émission soporifique de “Radio Jésus”. Mais ça te permet quand même de te créer une petite sonothèque de podcasts sur des livres et des articles scientifiques compliqués et de devenir plus intelligent en faisant du sport par exemple.
👉️ Pour essayer soi même, il suffit d’aller sur PDF2Audio.
Voici le mode d’emploi :
Il te faut pour commencer :
1. Un document PDF à envoyer (tu peux en trouver sur le site Arxiv par exemple si tu veux une étude bien compliquée)
2. Une clé API OpenAI. Pour cela il faut aller ici et te créer un compte. Puis va sur ton profil et sélectionne “UserAPI key.” Clique ensuite sur new secret key (donne lui n’importe quel nom) et copie-colle la clé. (Il faut que tu ais mis ta CB pour avoir une clé API).
Ensuite retourne sure PDF2Audio.
Uploade ton fichier dans la fenêtre à gauche. Choisis (en haut à droite) dans le menu déroulant “Podcast (français)”. Tu peux corriger les différents prompts si tu veux. Sélectionne ton modèle (GPT-4o va très bien et est moins cher que o1). Puis clique sur “Generate Audio” !
ALLO CHAT GPT ?
Si tu vois ce gros rond bleu nuages et pas juste le rond blanc, c’est bon, tu as la nouvelle voix !
En fait, la voix, c’est un peu la grande mode du moment. Sans doute parce que ça fait très science-fiction et que les CEO adoooorent la science-fiction. Meta sort bientôt la sienne. Et OpenAI a lancé cette semaine le nouveau “voice mode” (mode vocal) de ChatGPT dont ils avaient parlé au printemps.
Mais pas en Europe.
Donc si tu veux QUAND MÊME l’essayer même si c’est pas super RGPD, il faudra être malin.
Voici les étapes :
Installe un VPN sur ton iPhone (par exemple NordVPN)
Règle ton VPN Etats-Unis et active le VPN dans les réglages de ton iPhone.
Vas sur l’AppStore et mettre à jour l’application ChatGPT.
Ouvre l’application, démarre un chat et clique sur le petit bouton blanc à droite. Tu devrais voir un gros rond bleu comme un ciel nuageux.
Dis bonjour.
Mes premières impressions :
Alors au début c’est assez intimidant. Voire perturbant. La voix est vraiment très réaliste, même en français.
Le nouveau module de voix excelle dans le “small talk” (le bavardage sans intérêt). Tu peux la faire chuchoter, prendre des accents, ou changer de voix…
Ça marche très bien en mode coach ou prof de langues, voire même en interlocuteur fictif pour tester tes compétence… Amusant aussi pour lui faire raconter une histoire aux enfants (demande lui de prendre des voix différentes pour les personnages). Voilà.
C’est beaucoup moins convaincant dès que tu rentres dans de vraies conversations. La voix devient plus monotone et on reconnait bien la façon de s’exprimer un peu bornée de ChatGPT. On se lasse vite.
Ce que j’ai appris :
La surcouche algorithmique vocale modifie le comportement de ChatGPT : il est plus sensible à la dynamique de l’échange. Du coup il est moins consistant.
J’en conclue qu’il faudrait adapter sa façon de “prompter” (de donner des instructions). Plutôt que de structurer ton prompt de départ, essaie de structurer la conversation.
Ma suggestion : commence simplement et brièvement (donne le cadre et mets le dans un rôle), puis utilise des méthodes de dialectique pour le piloter. Voici des exemples de “prompts vocaux” que tu peux insérer dans une conversation.
# Techniques de Progression Dialectique
1. *Invitation à poser des question* "Avant de répondre, pose-moi trois questions pertinentes qui t'aideraient à mieux comprendre le contexte ou à affiner ta réponse."
2. *Demande d'approfondissement* "Peux-tu approfondir ce point ? Quelles sont les implications que tu n'as pas encore mentionnées ?"
3. *Invitation à la créativité* "Fais une connexion inattendue entre ce concept et un domaine totalement différent."
4. *Remise en question* "Quel serait l'argument le plus fort contre la position que tu viens de présenter ?"
5. *Analyse des biais* "Quels biais potentiels pourraient influencer ton raisonnement sur ce sujet ?"
6. *Scénario hypothétique* "Imagine un scénario futur où cette idée est poussée à l'extrême. Quelles en seraient les conséquences ?"
7. *Changement de perspective* "Adopte le point de vue opposé et défends-le de manière convaincante."
8. *Demande de synthèse critique* "Résume les points clés de notre discussion en identifiant les questions cruciales qui restent sans réponse."
9. *Exploration des limites* "Quelles sont les limites ou les faiblesses potentielles dans le raisonnement que tu as présenté ?"
10. *Invitation à la nuance* "Peux-tu nuancer ta position en prenant en compte des contextes ou des situations différentes ?"
11. *Demande de méthodologie* "Explique la méthodologie ou le raisonnement que tu utiliserais pour vérifier empiriquement cette affirmation."
Étudie son “system prompt” (les instructions systèmes qui sont données au mode vocal par OpenAI). Un hacker l’a piraté ici. Lis le, c’est hyper intéressant. On apprend par exemple que “ChatGPT voice mode” doit refuser de flirter avec les humains (ce qui à mon avis est le premier truc que les gens vont essayer de faire), il/elle ne doit pas chanter (droits d’auteurs ?) et doit toujours se rappeler qu’il/elle n’est pas humain (haha)…
LES CHIFFRES QUI PARLENT
L’usage de l’IA générative bat des records
Ici on voit la fréquence d’usage et le temps passé à utiliser l’IA générative.
Une étude américaine parue en septembre le confirme : l'IA générative (c’est à dire ChatGPT et ses amis) connaît une adoption plus rapide que les PC et Internet à leurs débuts.
Taux d'adoption de l'IA générative après 2 ans : 39,5%
Internet après 2 ans : 20%
PC après 3 ans : 20%
L'adoption est plus élevée chez les jeunes, les diplômés et les hauts revenus. Mais les ouvriers l’utilisent beaucoup également (1 sur 4 le font régulièrement).
Mais quelle est la fréquence d’usage ?
32% d'utilisateurs hebdomadaires.
10,6% de la population l'utilise quotidiennement
10,9% des travailleurs l'emploient chaque jour au travail
6,4% s'en servent quotidiennement hors travail
Les 3 principaux usages ?
Création de contenus
Tâches administratives
Résumé et traduction
SALUT L’IA-RTISTE
Ce clip de Snoop Dogg a été entièrement réalisé avec l’IA mais…
… il a demandé 2 mois de travail et une équipe de 8 artistes. Qui a dit que l’IA ne faisait que voler des emplois ? Les outils ne font pas tout, le talent et la maîtrise aussi. La différence c’est que de nouveaux talents vont émerger. Et de nouvelles audaces visuelles à la portée de (presque) tous.
La vidéo a été réalisée par l’agence d’artistes IA Dor Brothers, avec les outils suivants :
Pour les images (servant de base aux vidéos): Ideogram, Midjourney, MagnificAI
Pour les vidéos : RunwayGen3, LumaLabs, KlingAI.
Et un bon outil de montage !
LA CITATION À MÉDITER
Le physicien Richard Feynman a laissé la phrase suivante sur un tableau noir peu avant sa mort : "Ce que je ne peux pas créer, je ne le comprends pas." Le cerveau est notre source d'inspiration principale pour construire l'IA, et l'IA est notre test décisif pour évaluer notre compréhension du cerveau.
PROMPTOLOGIE
Développe ton esprit critique avec l’IA
Alors il y a plein de façons de le faire. Et les IA génératives, pour peu qu’on fasse l’effort de leur demander, sont des compagnons intéressants pour nous aider à sortir de nos biais cognitifs.
Nous allons commencer avec notre ami ChatGPT.
Essaie ce prompt :
Mettez-moi au défi en me posant une série de questions stimulantes sur l'intelligence artificielle générale. Posez les questions une par une et attendez ma réponse à chaque fois. Après chaque question, donnez votre avis sur ma réponse en identifiant les limites, les faiblesses et les biais possibles dans mon raisonnement. Puis suggérez-moi comment améliorer mon esprit critique et mes compétences réthoriques sur ce sujet.
Essaie par exemple de remplacer [SUJET] par “Intelligence Artificielle Générale” (la fameuse AGI, l’intelligence forte que tout le monde cherche à atteindre). Puis teste de nouveaux sujets. Si tu veux évoquer des sujets plus d’actualité, choisis plutôt Claude, dont la connaissance interne s’arrête en avril 2024. Et, au-delà de cet aspect, ses réponses sont plus fines et plus intéressantes.
Deuxième idée : crée toi-même un jeu d’esprit critique et partage le avec tes amis.
Pour cela, connecte-toi à Claude. Ce chatbot concurrent de ChatGPT propose une expérience unique. Pense à aller dans les paramètres pour activer “artifacts”. Ça permettra au modèle de coder un programme mais surtout de le faire tourner !
On va créer un jeu autour du problème de Monty Hall.
C’est quoi le problème de Monty Hall ? C’est une thèse hyper contre-intuitive qui va te faire des noeuds au cerveau. Après l’avoir entendu 20 fois, mon cerveau n’arrive toujours pas à y croire… Très surprenant.
Si tu ne connais pas, demande d’abord à Claude de t’expliquer.
Puis entre ce prompt pour créer un jeu qui te permettra de vérifier cette théorie étonnante.
Crée un simulateur interactif qui explique le problème de Monty Hall.
Pense bien à activer la fonctionnalité “Artifact” dans les paramètres.
La première version du jeu sera sans doute pas terrible. Mais tu peux l’améliorer en lui donnant des instructions complémentaires. Moi je lui ai juste dit : “Tu peux mieux faire !”. Si si…
Si ça te saoule de le faire, tu peux regarder ce que j’ai réussi à développer ici alors que je ne sais pas coder.
Parce que, oui, tu peux partager ton “artifact” via un lien.
Tu veux d’autres idées de jeu ? Demande à Claude !
Donne moi 10 jeux d'illusions d'optique connus.
Choisis en un et essaie d’en faire un jeu ! Par exemple, j’ai fait ce jeu sur l’illusion de Müller -Lyer.
(Et merci au professeur Ethan Mollick de m’avoir suggéré l’idée…)
😍 Pour apprendre les bases de l’art du prompt et maîtriser parfaitement ChatGPT et tous ses amis Claude, Gemini et Mistral : retrouve ma formation (attention valable jusqu’à mardi soir).
OUTILS ET TUTOS
3 outils et tutoriels intéressants trouvés sur Internet
Ici j’ai juste envoyé une photo d’un flacon de parfum. Flair a retiré le fonds, m’aide à la placer sur l’image aevc d’autres accessoires, puis l’IA génère une image finale à droite.
Un outil assez bien fait (et facile à prendre en main) pour générer des photos avec tes produits (vêtements, flacons etc). Ça s’appelle Flair AI.
Comment créer une veille d’infos automatisée avec l’IA (niveau intermédiaire). Un tuto très clair proposé en français par Ulysse Rajim dans la super newsletter d’Olivier Martinez. Alors attention parce que la veille d’info avec l’IA, c’est toujours un peu traitre (l’IA n’a pas accès à tout le contenu, quand elle y a accès, et elle risque d’halluciner). Mais c’est super intéressant pour apprendre à automatiser sans coder.
Comment créer un avatar IA et le faire parler… avec la synchronisation des lèvres. Un tuto très simple (en anglais) en trois étapes : Midjourney, KlingAI et Lipdub AI. A lire ici.
PLONGE ! 🤿
Les séries Génération IA, tu connais ? Pas encore ? Bah voilà…
🤩 Pour retrouver plus de conseils sur l’art du prompt visuel, abonne-toi à ma série “Comment créer de belles images avec l’IA” : des newsletters très courtes pour maitriser les IA génératives d’images en six étapes.
PARTICIPE !
On construit cette lettre ensemble !
Vous êtes désormais 21400 à recevoir cette lettre. Et vous avez apprécié la dernière édition, merci !
🟩🟩🟩🟩🟩🟩 Top ! (95%)
⬜️⬜️⬜️⬜️⬜️⬜️ Bien mais... (4%)
⬜️⬜️⬜️⬜️⬜️⬜️ Bof... (1%)
Le problème c’est que, dimanche dernier, le taux d’ouverture a été plus faible que d’habitude. La raison ? Gmail a visiblement classé “Génération IA” dans l’onglet “Promotions” et moins de gens l’ont vue ! C’est super injuste. Thomas suppose que la présence répétée du mot “gratuit” dans la newsletter a été jugée, hum, suspecte par l’IA de Google. Halala… ces robots qui font la loi…
Bon allez, on s’en fout. À toi de voter !
Comment as-tu trouvé cette édition ? Vote ici et laisse tes commentaires pour nous aider à nous améliorer ! Dis-moi aussi ce que tu aimerais voir en plus ou en moins.
Comment as-tu trouvé cette édition ?Vote et laisse un commentaire pour me dire ce qui t'a été utile et ce que je pourrais améliorer ! |
Merci de nous avoir consacré un peu de ton temps. Je te souhaite une bonne semaine !
🎙️Benoit, Thomas et FlintGPT.
Comment activer la nouvelle voix de ChatGPT sur ton mobile