- Génération IA
- Posts
- Le jour où les machines seront créatives
Le jour où les machines seront créatives
Avec Flavien Chervet, je te propose d'explorer les parallèles surprenants entre la créativité naturelle et artificielle. Et comment ils remettent en question notre vision de l'intelligence et de l'innovation. Accroche-toi !
Bonjour !
J’espère que tu vas bien !
Ce matin, je te propose un peu de matière pour réfléchir.
On va parler d’IA et de créativité. Mais on ne va pas parler de ta créativité à toi. On va parler de celle des machines.
Le sujet va peut-être te sembler insensé. Les machines ne PEUVENT PAS être créatives, n’est-ce pas ?
Par exemple : elles n’ont rien à exprimer.
Sauf que ce n’est pas si simple que ça. Pour explorer ce sujet absolument renversant, j’ai rencontré Flavien Chervet. Son livre “Hypercréation” explore justement cette idée. Et il se trouve qu’il est bien documenté. En le lisant, je suis allé de surprise en suprise.
Accroche toi !
Je suis Benoît Raphaël, et avec Thomas Mahier (ingénieur en IA) et FlintGPT (robot un peu simplet mais gentil), je te propose de mieux comprendre et maîtriser l’intelligence artificielle.
Si on t’a transféré cette lettre, abonne-toi en un clic ici.
Si tu es abonné(e) et que tu souhaites te désabonner, pas de panique ! Va en bas cette lettre et clique sur le lien “vous désabonner ici”.
😍 Aujourd’hui voici comment tu vas devenir plus intelligent(e) avec Génération IA.
→ Une machine peut-elle être créagive ? Je te résume en 5 minutes le livre passionnant de Flavien Chervet, “Hypercréation”.
→ Apprends à “prompter” avec ce générateur d’images en temps réel.
→ Essaie des vêtements avec l’IA !
→ Essaie un petit prompt ChatGPT bien pratique…
→ Découvre ma sélection de tutoriels et d’outils. Le quatrième va te faire gagner du temps.
J’ai rencontré Flavien à Bali. Il y était venu passer quelques semaines pour écrire son prochain livre (un ouvrage passionnant/flippant sur les risques existentiels de l’IA, dont la sortie est prévue en 2025).
Et comme j’habite à Bali, on en a profité pour se voir et discuter de son travail. Ça tombait bien, je venait juste de finir son précédent essai, “Hypercréation”, qui m’avait fait me poser des milliards de questions.
Flavien Chervet (à gauche) en visite à Bali. Tu noteras sa belle écharpe complètement inutile vu la température. Ah ces parisiens !
À la question, les algorithmes peuvent-ils être créatifs, la réponse la plus rationnelle est “non”.
Lorsque l’on pense IA et créativité, on pense en général à des outils d’IA générative comme ChatGPT (pour le texte) ou Midjourney (pour les images). Comme ces modèles s’appuient sur leur digestion des créations humaines et ne font que prédire le prochain mot ou pixel, on a résolu cette question agaçante en se disant : ces outils ne sont pas créatifs, mais nous pouvons être créatifs avec eux.
Ok. Mais allons plus loin.
Prenons la nature, par exemple. Elle n’est ni “intelligente” au sens où on l’entend, ni humaine.
Est-elle créative ? Oui, affirme Flavien. Et il argumente.
Flavien définit la créativité selon deux axes.
Le premier est celui de l’originalité - adaptabilité. L’originalité c’est cool, mais si ce que l’on invente n’a aucun intérêt pratique ou exploitable, ça ne mène pas à grand chose. Pour obtenir un objet vraiment “nouveau”, il y a donc un équilibre à trouver entre originalité et adaptabilité, entre le couteau fait en mousse et le couteau électrique par exemple. Une sorte de discrimination créative si tu veux…
Le second axe est plus intéressant. C’est l’axe dérivatif - disruptif. On peut avoir une créativité dérivative (on invente quelque chose de différent à partir de ce que l’on a appris) ou disruptive (on casse l’ordre établi).
C’est ce que fait la nature. Elle s’adapte en permanence et chaque nouvelle naissance dérive de l’ancienne. Et quand survient par hasard une anomalie, genre un troisième pied au dessus du nez (disruption), la créature qui parvient à survivre (discrimination) crée un nouveau paradigme dans l’évolution.
Créativité naturelle - image générée avec Midjourney 6.1
La nature est donc bien créative dans ce cadre théorique. Sauf que son process créatif est très lent, évidemment. Et qu’elle n’a aucune “intention” (à moins de considérer qu’elle a un plan, mais je te propose de laisser cette question de côté pour le moment sinon on en a pour la journée).
Conclusion : on peut ne pas avoir de cerveau humain et faire preuve de créativité. C’est juste différent.
Si la nature peut être “créative”, alors une machine peut l’être. Théoriquement. C’est à dire qu’elle pourrait, par ce simple mécanisme d’originalité-adaptabilité et de disruption-discrimination, proposer des approches complètement nouvelles, sans nécessairement dériver de l’observation de ses créateurs humains.
Alors ce n’est pas exactement le cas de Midjourney par exemple, qui n’est que dérivatif, puisque les “créations” de cette IA générative d’images ne découlent que de son entrainement sur des millions d’images humaines et dépendent de ton “prompt” pour prendre forme. C’est donc toi qui fait preuve de créativité (ou pas) avec elles.
Mais dans l’histoire de la création d’images, il existe une technique dont on a très peu parlé dans le grand public et qui, pour la première fois, a ouvert une brèche dans cet interdit absolu : les CAN. Les “creative adversarial network”.
De quoi s’agit-il ? Ce sont des modèles d’IA dits “créatifs”. Ils ont été théorisés par le chercheur Ahmed Elgammal Blingchen en 2017. Avec les CAN (qui sont une dérivation des GAN, plus consensuels), on fait s’affronter deux réseaux de neurones. Le premier va créer n’importe quelle image (à partir de ses données d’entrainement, toujours) et le second (le discriminateur) va le sanctionner dès que ce qu’il produit ressemble à une oeuvre ou un style déjà existant. En résumé : il n’accepte que les images inclassables.
En 2017, un éditorial d'Artsy a salué son travail sur l'art généré par l'IA comme « la plus grande réussite artistique de l'année ». Plus intéressant, lors d’une expérience menée par l’expostion Art Basel, les visiteurs étaient invités à juger la créativité de différentes oeuvres d’art abstrait. Des oeuvres humaines ou des oeuvres générées par un modèle CAN. Lesquelles ont gagné ? Celles des CAN ont été jugées plus structurées, plus inspirantes et surtout… on leur prêtait plus d’intentionnalité que les oeuvres des humains. Ce qui était techniquement faux (en tout cas sur l’intentionalité), et un peu perturbant, vu que ces machines peuvent générer des millions d’images inclassables. Bref, ça m’a donné de quoi méditer.
Mais ce n’est pas dans l’art que l’on a observé les exemples les plus renversants de “créativité”. Mais dans le jeu de Go.
Jusquà l’arrivée d’AlphaGO et sa victoire tonitruante en 2016 contre le champion du monde, Lee Sedol, les IA exploitaient des processus dérivatifs. Ces dernières se bornaient à imiter les humains (en observant les parties humaines) pour apprendre et optimiser les stratégies, en y ajoutant leur puissance de calcul.
Mais contre Lee Sedol, Alphago a remporté la partie en jouant un coup “étrange”, que personne n’aurait pu prévoir. Comment cela a-t-il été possible ?
AlphaGo (réprésenté par un humain pas super expressif à gauche qui joue les coups de l’IA) et Lee Sedol qui est passé par toutes les phases de l’émotion durant cette partie mythique.
AlphaGo a pu réaliser des coups inhabituels malgré son entraînement sur des parties humaines (dérivatif) grâce à plusieurs facteurs clés. D'abord, il utilise des réseaux de neurones profonds qui analysent des millions de parties pour évaluer les meilleures positions et coups. Ensuite, sa recherche par “arbre Monte Carlo” explore de nombreuses possibilités (avec une part d’exploration heuristique) en simulant des parties complètes, permettant ainsi de découvrir des stratégies innovantes que les humains n'ont pas forcément envisagées.
De plus, l'algorithme équilibre habilement l'exploration de ces nouveaux coups et l'exploitation des mouvements efficaces déjà identifiés, favorisant ainsi l'innovation.
Bref, Alphago exploite toutes les palettes de la créativité.
Le coup étrange d’Alphago est aujourd’hui enseigné dans les écoles de Go.
Quand AlphaGO explose les règles - Image générée avec Midjourney 6.1.
C’est d’ailleurs cette approche révolutionnaire, par arbre de Monte-Carlo, qui a en partie inspiré les recherches sur le nouveau modèle d’OpenAI, “o1”, capable de “raisonner”.
Plus intéressant, une version ultérieure, AlphaGo Zero, s’est même passé de l’entrainement humain. AlphaGo Zero s’est auto-entraîné SANS données humaines, en jouant contre lui-même. Ce qui lui a permis de découvrir des stratégies entièrement nouvelles.
Pour la première fois, avec AlphaGo Zero, la créativité venait de la propre expérience de la machine, pas de son enseignement humain !
Bien sûr, cet exploit n’a été possible que parce que l’IA est placée dans un contexte très fermé (un jeu avec des règles et un environnement simples).
On est aujourd’hui incapable de reproduire ce type de comportement créatif dans le vrai monde, beaucoup plus complexe et encore méconnu.
Certains s’y sont pourtant essayé.
C’est ce qu’on appelle l’IA développementale.
Contrairement aux systèmes d'IA actuels, formés principalement sur des ensembles de données massives générées par l'homme, l'IA développementale cultiverait sa propre compréhension du monde.
Tu peux découvrir cette technique dans ce cours (en français) :
C’est une approche encore très expérimentale. Selon Flavien, elle pourrait potentiellement déboucher sur des perspectives et des solutions uniques qui ne seraient pas limitées par les préjugés ou les idées préconçues de l'homme.
Si la machine entrainée sur des données humaines n’a théoriquement rien à exprimer, que dire d’une machine qui développe sa propre expérience du monde ?
Une autre créativité - Image réalisée avec Midjourney 6.1.
Pour Flavien, l’émergence de cette “créativité artificielle”, par le développement de machines développant leur “savoir” via leur propre expérience, nous pousse à revoir l’ordre établi. Et envisager une approche de l’intelligence moins centrée sur celle de l’humanité. Par l’émergence d’une intelligence “autre”, nous passerions du spectre du remplacement à celui de la co-évolution entre plusieurs intelligences.
Et si les machines pouvaient être de nouveaux compagnons de voyage, interroge l’artiste Anicka Yi lors d’une étonnante conférence TED ? Qu’auraient-elles à nous apprendre que nous ne voyons pas ? Quand on y réfléchit un peu, la nature regorge de ces “intelligences autres” que Descartes nous a appris à ignorer. Les arbres ou les poulpes par exemple.
L’une des étranges machines d’Anicka Yi…
L’approche est philosophique, certes, voire poétique. Mais elle nous donne quelques indices sur les évolutions possibles de l’IA. Au-delà de la voie de l’apprentissage massif et industriel qui a donné naissance à notre si consensuel ChatGPT, il existe d’autres approches. La machine a-t-elle besoin de penser comme nous pour être créative ou utile ? Peut-être pas.
Pour aller plus loin :
👉 Lire ce qu’Ahmed Elgammal pense des IA génératives d’images actuelles (du mal) et comment il envisage l’avenir de l’art IA (des modèles entrainés sur les oeuvres d’un artiste qui l’aideraient à trouver de nouvelles voies).
👉 Apprends le Go avec AlphaGo teaching tool.
👉 Lis le billet de Morgane Soulier, consultante et artiste IA, dans le magazine Le Point. Elle propose une réflexion intéressante sur l’intelligence artificielle.
👉 Confronte cette approche avec la vision radicalement opposée de l’historien Yuval Noah Harari qui, dans son dernier livre (“Nexus”), prédit la catastrophe : “Nous pourrions nous retrouver à vivre dans les rêves d'une intelligence extraterrestre”… Fichtre.
👉 Achète le livre de Flavien, “Hypercréation”.
ASTUCE
Maitriser l’art du prompt visuel en temps réel
Bon, les images ne sont pas ouf, mais ça ne permet de bien comprendre comment l’ordre des mots peut jouer sur la précision, ou comment certains mots peuvent être parfois ambigus pour la machine.
Mystérieux ce titre, non ?
En fait ce que je veux dire c’est que pour créer de bells images, il faut maitriser à la fois la structure de ton prompt ET trouver les bons “tokens” (c’est à dire les bons mots ou expressions).
Pour m’entrainer et améliorer ma compréhension du prompting, j’ai un petit truc que je voudrais partager avec toi.
La plateforme Leonardo propose une génération d’images en temps réel (“Leonardo Realtime Gen”). Tu rentres tes mots et l’image se forme au fur et à mesure que tu écris. C’est assez amusant à faire, mais au delà de gadget, ça te permet de bien comprendre comment l’IA réagit aux mots et à l’ordre des mots.
Leonardo Realtime Gen n’est pas un super générateur d’images (c’est un modèle très léger), et chaque modèle a différentes sensibilités, mais ce mode ‘live” est assez intéressant pour améliorer ta technique de prompting.
Une fois que tu as trouvé le bon prompt, tu peux revenir à Midjourney pour obtenir des images beaucoup plus intéressantes.
Image réalisée avec Midjourney 6.1.
🤩 Pour retrouver plus de conseils sur l’art du prompt visuel, abonne-toi à ma série “Comment créer de belles images avec l’IA” : des newsletters gratuites très courtes pour maitriser les IA génératives d’images en six étapes.
L’OUTIL GRATUIT
Essaye des vêtements avec l’IA !
J’ai essayé avec la photo de ma copine, qui m’a répondu “Oh c’est cool mon chéri, mais pourquoi la robe est-elle devenue plus courte ?” Ralala, je sais pas moi…
Allez, maintenant on se détend avec cet outil assez rigolo qui va te permettre d’essayer des vêtements.
Je te propose de tester l’application open-source (et donc gratuite) “Kolors”. Elle te permet de mettre une photo de toi (ou de qui tu veux), puis une photo d’un vêtement (par exemple une photo récupérée dans un catalogue) et de voir le résultat !
J’y vois plusieurs usages : créer des photos de produit pour un créateur avec des mannequins virtuels, sans séance de shooting ou tester des vêtements en ligne (bon, même si l’IA interprète un peu comme elle veut, haha, donc cantonne-toi à des trucs simples).
La photo finale n’est pas de super qualité. Mais tu peux l’optimiser sur Magnific.ai.
👉️ Essayer Kolors.
ESPRIT CRITIQUE
Quand ChatGPT aide à lutter contre la désinformation
C’est une étude assez étonnante et qui fait du bien. Jusqu’ici on pensait le cas des adeptes de la post-vérité et des théories du complot comme irrécupérable. Les méthodes actuelles pour combattre le phénomène sont en effet chronophages et difficiles à mettre en œuvre à grande échelle. Des chercheurs ont prouvé le contraire.
Plus de 1000 personnes ont participé à cette étude du MIT. Durant cette expérience elle ont échangé avec ChatGPT pendant 8 minutes sur leurs croyances, le chatbot les confrontant aux faits.
Résultat ?
Le dialogue avec l'IA a réduit significativement la croyance en la théorie du complot, avec une réduction moyenne de 20% par rapport au groupe contrôle.
Cet effet persiste pendant au moins 2 mois.
L'IA est efficace pour un large éventail de théories du complot.
L'effet est observé même chez les personnes fortement attachées à leurs croyances.
LA CITATION QUI FAIT RIRE (ET RÉFLÉCHIR)
ChatGPT ? Un stagiaire bizarre !
J’aime beaucoup analogie entre ChatGPT et un stagiaire (sans dénigrer les stagiaires, hein). Parce que ça permet de mieux comprendre comment nous pouvons travailler avec les chatbots d’IA. Et pourquoi nous devons aussi toujours vérifier ce qu’ils font. Voici ce qu’en dit l’ingénieur Simon Willison :
Je l'appelle mon stagiaire bizarre. Parfois, je dis à ma femme Natalie : 'Tiens, j'ai demandé à mon stagiaire bizarre de faire ça.' Et ça marche, tu vois ? C'est en fait un bon modèle mental pour ce genre de situation. C'est comme avoir un stagiaire qui a lu toute la documentation de chaque langage de programmation, qui a tout mémorisé, mais qui est aussi un peu un théoricien du complot. Parfois, il sort des idées complètement absurdes, mais elles sont super complètes !
C'est le genre de stagiaire qui pense toujours avoir raison. Mais bon, c'est un stagiaire qu'on peut, je déteste dire ça, mais qu'on peut un peu tyranniser. Tu peux lui dire : 'Non, refais-le, ce n'est pas bon.' Et tu n'as même pas à te sentir coupable, ce qui est plutôt pratique.
PROMPTOLOGIE
Comment mettre à jour un document en 10 secondes ?
C’est un prompt tout bête, mais super pratique. Imagine que tu as écrit un texte (un article, un communiqué de presse, un cours…) mais que depuis son écriture pas mal de choses ont changé. Tu pourrais tout ré-écrire, et ce n’est pas toujours simple parce que parfois ces infos nouvelles modifient le sens même de ton propos.
Bonne nouvelle : ChatGPT et ses amis sont plutôt bons pour faire ce qu’on appelle de l’inférence implicite. Il va déduire la transformation du texte par rapport à tes données nouvelles et à sa connaissance interne.
Pour faire ça, voici un petit prompt proposé par Thomas :
Lis attentivement ce vieux texte:
<texte>
... ... ...
</texte>
Lis attentivement ces nouvelles données:
<data>
- ...
- ...
- ...
</data>
Réactualise le texte.
Tu noteras les délimiteurs présents dans le prompt (les crochets entre lesquels sont placées les données à traiter). Quand les instructions sont un peu complexes, ils aident le modèle de langage à s’y retrouver plus facilement et à différencier les données (data, texte) et les instructions.
👉 Si tu veux maîtriser parfaitement le prompt, découvre ma formation ultime ChatGPT (qui marche aussi avec Claude, Gemini…). Et profite d’une réduction rien que pour toi (valable jusqu’à mardi !).
EXPLORER…
4 outils et tutos intéressants trouvés sur Internet
Diffusers Image Outpaint
Cet outil (gratuit) d’outpainting est assez addictif. L’outpainting c’est la capacité d’une IA à imaginer le reste d’une image (à la différence de l’inpainting où tu fais générer l’IA à l’intérieur de l’image). Envoie n’importe quelle image ou photo célèbre et laisse l’IA imaginer le reste.
Notdiamond, la super plateforme qui te permet de tester tous les modèles de langage gratuitement, propose désormais également un accès gratuit aux principales IA génératives d’images (Flux, Stable DIffusion 3, Dall-E… mais pas Midjourney ni Ideogram) et de les comparer au même endroit.
Un nouveau générateur de musique vient concurrencer Udio et Suno. Et c’est pas mal ! Tu génères des chansons à partir d’un prompt mais tu peux aussi diriger le style avec un lien youtube ou un fichier son. Tu peux aussi choisir des voix pré-enregistrées. Découvre Mureka ici.
Un mini tuto pour apprendre à faire des présentations powerpoint avec les couleurs et logos de ta marque. L’outil ? Gamma.
I Didn't Believe It 🤯
When AI Created My Presentation in 30 Seconds,
With Brand Colors and Logos.
But Here's How You Can Too: ♨️
— Tanvir Anjum (@codemindtanvir)
5:21 AM • Sep 21, 2024
PARTICIPE !
On construit cette lettre ensemble !
Vous êtes désormais 21094 à recevoir cette lettre. Dimanche dernier, l’édition spéciale ChatGPT o1 a été un véritable carton. 100% d’avis positifs ! Wow, merci merci !
🟩🟩🟩🟩🟩🟩 Top ! (98,3%)
⬜️⬜️⬜️⬜️⬜️⬜️ Bof... (0%)
⬜️⬜️⬜️⬜️⬜️⬜️ Bien mais... (1,7%)
Bon, on ne le fera pas tout le temps (bonjour les heures suplémentaires !), d’où le nom “édition spéciale”…. surtout qu’on s’était engagé à te proposer des éditions plus courtes en plus de nos séries. Mais je suis super heureux de voir que ça a été utile !
Et, comme toujours, notre objectif n’est pas de proposer une apologie de l’IA, mais une pédagogie de l’IA.
A toi de voter !
Comment as-tu trouvé cette “édition pas spéciale” ? Vote ici et laisse tes commentaires pour nous aider à nous améliorer ! Dis-moi aussi ce que tu aimerais voir en plus ou en moins.
Comment as-tu trouvé cette édition ?Vote et laisse un commentaire pour me dire si ça t'a été utile (ou pas) et pour m'aider à améliorer les prochaines lettres ! |
Merci de nous avoir consacré un peu de ton temps. Je te souhaite une bonne semaine avec ton stagiaire bizarre !
👻 Benoit, Thomas et FlintGPT.