- Génération IA
- Posts
- Mon guide 2025 pour maîtriser ChatGPT Images
Mon guide 2025 pour maîtriser ChatGPT Images
Avec son format hybride de prédiction de texte et de pixels, le nouveau modèle d'OpenAI change radicalement notre manière de "prompter" pour obtenir des images. Voici comment bien l'utiliser.

Bonjour !
Aujourd’hui on va faire atelier peinture.
On va explorer la nouvelle compétence de ChatGPT.
Désormais, il sait dessiner.
Tu vas me dire : mais avant aussi, non ? Haha, pas vraiment en fait.
Je t’expliquerai.
Ce qui est sûr, c’est que si tu pensais savoir prompter des images avec Dall-E, Flux ou Midjourney, eh bien il va falloir tout ré-apprendre !
Et c’est moins simple qu’il n’y parait. C’est ce que je te propose d’explorer avec moi aujourd’hui. Tu verras, il y aura des surprises… et pas mal de pièges !
Je suis Benoît Raphaël, et avec Thomas Mahier (ingénieur en IA) et FlintGPT (robot un peu simplet mais gentil), je te propose de mieux comprendre et maîtriser l’intelligence artificielle.
Si on t’a transféré cette lettre, abonne-toi en un clic ici.
Si tu es abonné(e) et que tu souhaites te désabonner, pas de panique ! Va en bas cette lettre et clique sur le lien “vous désabonner ici”.
😍 Aujourd’hui voici comment tu vas devenir plus intelligent(e) avec Génération IA.
→ Maîtrise une création artistique renouvellée avec le nouveau modèle ChatGPT Images.
→ Découvre quelles sont les meilleures IA génératives d’images en 2025.
→ Et apprends comment les médias se sont emballés sur une fausse info autour de ChatGPT et de la politesse.
Bon, tout d’abord il faut que te rappelle un point technique. Sais-tu comment l’IA génère des images ?
Sans entrer dans les détails, le procédé n’a pas beaucoup évolué depuis trois ans. Le modèle d’intelligence artificielle est mis devant une image bruitée (comme la neige d’un écran de télé) et on lui demande de la débruiter, couche après couche (par exemple : une couche contours, une couche contraste etc) pour générer une image correspondant à une instruction visuelle (par exemple : un chat sur un canapé). On appelle ces modèles, les modèles de diffusion. Ce sont eux qui alimentent les IA stars du moment : Midjourney, Firefly ou Flux.
Mais depuis le 25 mars dernier, ChatGPT a jeté son cousin “Dall-E 3” à la poubelle. Dall-E était un modèle de diffusion chargé de générer des images moches dans ton ChatGPT quand tu lui demandais de dessiner un mouton. Le modèle de langage de ChatGPT (GPT-4o) envoyait ses prompts à Dall-E, qui dessinait le mouton à sa place.
Désormais, c’est GPT-4o qui dessine. Et comme c’est un modèle de langage à la base, il est devenu une sorte d’écrivain de l’image.
Au lieu de débruiter l’image couche par couche, il prédit le prochain pixel, de gauche à droite et de bas en haut. C’est d’ailleurs assez compréhensible puisque ChatGPT Images (c’est son deuxième nom) est en fait un modèle auto-regressif comme les modèles de langage, dont il a hérité des capacités.
Tu me suis ? Bon. Tant mieux parce que c’est important pour la suite.
Pour que tu comprennes je t’ai fait une petite mosaïque.
Quand je lui demande de dessiner “un chat”, Midjourney débruite l’image couche par couche (du machin vert au chat mignon derrière le mur). En revanche ChatGPT Images, dessine pixel par pixel pour obtenir un chat moins artistique mais beaucoup plus précis.

En haut Midjourney qui imagine “un chat”. En bas, ChatGPT qui imagine “un chat”, mais selon un process différent.
Qu’est-ce que ça change concrètement ? Eh bien presque tout.
ChatGPT Images n'est pas juste un générateur d'images avec un prompt en entrée. Cette fonctionnalité est intégrée en natif, au cœur même de l'architecture du modèle de langage “omnimodal” GPT-4o. “La génération d'images 4o peut exploiter toutes ses connaissances pour appliquer ses capacités de manière subtile et expressive”, explique OpenAI. Il "réfléchit" avant de peindre… et même en peignant si j’ose dire.
Il transforme l'acte de création en une conversation avec la machine.
Cette particularité offre quatre avantages considérables:
Une adhérence prompt-image que je n'avais jamais vue ailleurs : l'image semble reproduire méticuleusement ce que je demande, plutôt que simplement s'en inspirer.
Une interprétation quasi intuitive des instructions complexes : là où je devais auparavant décomposer précisément chaque élément, je peux désormais être plus naturel et bref. Si je lui demande raconte moi une histoire drôle sous forme de BD, je n’ai pas besoin de lui donner le texte, il l’invente au fil de son dessin.
Image réalisée par ChatGPT Images à partir d’une simple instruction : “Crée une BD qui résume les enseignements du livre “Le Petit Prince” en 4 cases”
Et justement, les textes : comme tu peux le voir dans l’image ci-dessus, ils sont parfaitement lisibles dans les images. Infographies, bandes dessinées, affiches avec slogans, le texte peut ENFIN être long. Il est impeccable… à quelques coquilles près.
Enfin, grâce à ce lent travail méthodique, il est capable de reproduire des photos et images presque à l’identique (j’ai bien dit “presque” !) ce qui permet de jouer avec la réalité : personnages persistants tout au long des images, intégration d’un produit à l’identique dans une image, modification d’une photo (tiens ajoute moi Xi Xiping déguisé en dragon à côté de cette photo réelle Donald Trump, merci…).
Évidemment, ces atouts sont accompagnés de leurs petits frères : les inconvénients.
La génération d’une image est trèèèès longue. Et s’il se plante, il faut tout relancer parce qu’il ne sait pas corriger ses erreurs. Il faut donc bien travailler ton prompt.
ChatGPT Images perd en créativité ce qu’il gagne en précision. Ce qui revient à dire qu’il fera exactement ce que tu lui demandes, pas plus. Donc si tu n’as pas de culture graphique, attends toi à des résultats précis mais qui se ressembleront tous.

À gauche la précision obsessionnelle de ChatGPT Images, à droite la créativité dissipée de Midjourney (Image : ChatGPT Images)
Autre inconvénient : sa nature auto-regressive fait que.. eh bien, le modèle auto-regresse dans la conversation ! Tu peux générer un chien, puis lui demander de lui mettre un costume de Star-Trek. Tu auras bien le même chien (ce qui est dèjà un exploit), mais si tu répètes l’opération plusieurs fois, l’image de ton chien va se dégrader. Et bien souvent tirer vers le jaune. Donc comme avec ChatGPT texte, quand il commence à dériver, il faut changer de conversation et repartir à zéro.
Tiens regarde, je me suis amusé à lui demander de reproduire ma photo à l’identique une fois, puis de la reproduire une deuxième fois etc. J’ai eu peur.

Prompt : “create the exact replica of this image, don't change a thing”. Ce qui est drôle c’est qu’il me dit à chaque fois : “voici une image parfaitement reproduite”. Preuve qu’il ne “voit” pas trés bien ce qu’il génère…
J’ai donc passé les 3 dernières semaines à triturer ce nouveau modèle dans tous les sens pour en sortir quelques conseils pour toi. Dont quelques-uns qui vont te surprendre !
Ce qui est sûr, c’est que tu vas pouvoir faire avec ChatGPT Images des créations qui étaient impossibles jusqu’à aujourd’hui. À condition de bien comprendre ses limites. Et de l’utiliser avec responsabilité. Depuis sa sortie, les médias sociaux ont été envahi d’images façon Ghibli et de représentation de soi-même en jouet. Ce qui, en plus de poser des problèmes de plagiat et de pollution visuelle, n’est pas non plus super écologique.
1. Comment l’utiliser ?
Bah c’est simple, tu ouvres ChatGPT, tu cliques sur le petit picto dessin et tu dis ce que tu veux qu’il dessine.

Il peut te faire une photo, un dessin, une pub, une infographie et même un poème enluminé.
Mais son atout le plus intéressant est aussi celui dont on parle le moins. Je dévoilerais ça à la fin.
2. Quatre astuces pour faire des trucs inédits avec ChatGPT Images
Alors pour faire simple on va jouer au jeu des “c’est surtout”.
1) C’est surtout… un graphiste : c’est à dire qu’il est efficace pour créer des flyers avec du texte, des publicités, des cartes de voeux et des infographies simples.
Par exemple je peux créer une boîte de capsules de compléments alimentaires qui rendent plus intelligents avec mon logo dessus. Et aller chercher sur Canva ou Pinterest un modèle de pub un peu moche mais qui semble bien correspondre.

Je lui demande de mettre mon produit dans la pub de l’adapter au concept de ma marque (fictive, hein…) avec les codes couleurs de ma marque. Il suffit de joindre les deux images et de lui dire :
Une publicité avec cette boite de Flint Pills (photo 1) mais avec cette mise en scène (photo 2). Adapte les couleurs et le message à celles de ma marque : [en français, couleur : #9EC6F3].

ChatGPT Images a complétement réinterprété l’image de référence et intégré parfaitement mon produit… il a même corrigé une coquille sur la boîte.
2) C’est surtout… un exécutant : pas du tout un créatif. Mal maîtrisé, il pousse au nivellement culturel. Donc si tu es graphiste, tout ira bien, si tu ne l’es pas, ça sera plus compliqué d’obtenir des résultats intéressants. Heureusement, il y a une parade.

ChatGPT Images, l’exécutant “docile mais pas créatif”, vu par l’ami Midjourney… quel taquin ce MJ !!
Si tu n’as pas les mots, il te reste les photos. ChatGPT adore combiner des images.
Tu peux par exemple lui demander de générer une image dans le style d’une autre.
Du coup ça m’a donné une idée.
Et si je faisais une collaboration entre une marque de chaussures et une marque iconique ?

A gauche mes chaussures vierges, à droite une chemise iconique Dior.
Je lui ai envoyé l’image d’une paire de sneakers blanches et celle d’une chemise Dior avec ses imprimés iconiques, et je lui ai simplement demandé :
Transforme ces sneakers en utilisant le style de cette autre photo.
Résultat :

Ok la collaboration est improbable, mais c’est pour l’exemple hein… tu peux aussi photographier des textures qui t’intéressent dans la rue et les combiner avec n’importe quel vêtement.
3) C’est surtout… un modèle de langage : et ça permet plein de choses étonnantes.
Plutôt que de lui envoyer une photo (ce qui n’est pas le plus écologique à grande échelle), je peux aussi lui décrire son style (ou demander à ChatGPT de le faire).
Mais pour que ma description soit la plus précise possible (et reproductible à l’infini), je me suis dit : et si je lui parlais en code ? ChatGPT comprend très bien le code. En particulier le langage JSON, un langage idéal pour véhiculer des données complexes avec un maximum de densité et un minimum de perte.
J’ai trouvé cette astuce chez un artiste qui lui a dédié un site Internet.
Par exemple, pour ce style on obtient le code suivant :

Je prompte donc comme ça et j’ajoute mon code JSON à la suite de ma description :
Photo d'une femme indonésienne, photo de mode en studio. Utilise le style suivant :
[code JSON].

Tu vas me dire : oui mais comment générer un code JSON ?
Demande à ChatGPT !
Par exemple : “crée moi un code JSON qui décrive exactement le style de cette photo”. Et voilà. Maintenant tu peux te créer TA bibliothèque de styles.
[J’adore cette approche de matrice JSON, ça me donne plein d’idées d’exploitation, par exemple pour écrire des romans ou des manuels avec l’IA]
Mais je suis allé encore plus loin…
4) C’est surtout… un modèle conversationnel. Comme tous les modèles de langage, GPT-4o excelle dans la conversation. Si tu veux travailler sur un projet créatif mais que ce n’est pas ton métier, tu peux converser avec lui et profiter de sa grande connaissance interne.
Je me suis créé un prompt qui, à partir d’une simple idée, transforme ChatGPT en coach créatif. Il échange avec moi et me fait découvrir des artistes, des courants culturels méconnus, fait des recherches sur Pinterest pour me montrer des images inspirantes et, à la fin, génère une image stupéfiante.
Comme cette sculpture.
Je suis parti d’un simple concept et ChatGPT m’a fait voyager à travers les cultures, les pays et l’histoire (“sculpture biomorphique”, “cyanotype superposé sur certaines surfaces”, “architecture paramétrique”…), pour aboutir à cette combinaison de techniques et à cette sculpture que j’adorerais faire en poterie !

Idée de départ : “L'intelligence artificielle générale : ami qui nous rendra plus humains ou ennemi aveugle ?”
Cette méthode, que j’ai appelée “Dialogue Engineering”, t’aide à te forger une culture visuelle et aide aussi le modèle à explorer sa connaissance par étapes successives. Ce n’est plus ton prompt qui crée l’image, mais la conversation qui y mène…
Il y a plein d’autres choses à explorer et je n’ai pas la place de tout partager ici. Si ça t’intéresse, je le fais dans ma formation à ChatGPT 2025. Elle t’apprendra : à bien prompter, à maîtriser l’art de la conversation (le Dialogue Engineering)… et à tirer le meilleur de ChatGPT Images.
Ce qu'il faut retenir
ChatGPT Images est un modèle autorégressif qui dessine pixel par pixel, contrairement aux modèles de diffusion comme Midjourney ou Dall-E.
Cette technologie hybride texte-image permet une meilleure compréhension des prompts et une précision exceptionnelle dans le rendu des textes.
Le modèle excelle dans les créations graphiques comme les infographies, publicités et BD, mais manque de créativité artistique.
La technique du "Dialogue Engineering" permet d'exploiter les capacités conversationnelles de ChatGPT pour enrichir tes créations visuelles.
Pour aller plus loin :
Quelles sont les meilleures IA génératives d’images en 2025 ? Je te donne mon classement argumenté. Tout dépend des usages en fait. À lire ici.
La formation “ChatGPT 2025 - Apprendre à converser avec l’IA” contient désormais une section spéciale de 10 vidéos sur la génération d’images avec ChatGPT Images et de nouveaux prompts. Tu peux la découvrir ici.
Breaking news : être poli avec une IA brûle-t-il la planète ?
Tu as peut-être vu passer cette information insolite : dire "s'il te plaît" ou "merci" à ChatGPT coûterait des millions de dollars en électricité et nuirait gravement à l'environnement. On retrouve cette "révélation" partout : Le Figaro, le New York Post, Yahoo Finance, et même des médias au nom rigolo comme Laptop Magazine qui affirment doctement que "être gentil avec ChatGPT pourrait être mauvais pour l'environnement".
En réalité, tout est parti d'une simple blague de Sam Altman sur X. Un créateur de contenu avait fait cette remarque pince-sans-rire : "Je me demande combien OpenAI a perdu d'argent en électricité à cause des personnes qui disent s'il vous plaît ou merci à leur modèle de langage."
Et Altman a répondu sous forme de boutade : "Des dizaines de millions de dollars, mais bien dépensés. On ne sait jamais…” Sous entendu : on ne sait pas ce qui va se passer demain si l'IA prend le contrôle de l'humanité.
Alors je sais qu'en voyant la tête de Sam Altman, on peut douter qu'il ait de l'humour.

(Image générée par l’IA Grok)
Mais un peu de réflexion permet de comprendre pourquoi c'est absurde.
Oui, ajouter des mots à un prompt demande théoriquement plus de puissance de calcul. Mais dire "merci" ou "bonjour" n'a pas plus d'impact qu'ajouter "lapin" ou "canapé" dans ta phrase. C'est juste un mot de plus, c’est à dire un “token”. Or, un échange entre toi et ChatGPT se compte en milliers de tokens. C’est marginal.
La vraie question environnementale derrière tout ça, c'est la vision systèmique : la consommation énergétique globale des centres de données qui alimentent ces IA. Et là, si on manque cruellement de données précises sur le coût exact d'une conversation avec une IA (j’en parlais ici), en revanche, nous savons que la consommation d'électricité des centres de données est étudiée et fait l'objet de projections. Aux États-Unis, par exemple, elle représente 4% de la consommation totale d'électricité (Source : FMI -2025).
Les projections montrent que cette consommation pourrait atteindre d’ici 5 ans un niveau comparable à celle de toute l'Inde actuelle. Mais l’impact environnemental dépend du mix énergétique de chaque pays. Or, on estime que si nous continuons avec les politiques énergétiques actuelles, les émissions mondiales de carbone pourraient augmenter de 1,2% d'ici 2030 à cause du boom de l'intelligence artificielle.
C'est un sujet important qui mérite mieux que des infos approximatives et racoleuses. Il y a trop de questions éthiques, environnementales et de sécurité autour de l'IA pour perdre du temps avec des absurdités. Nous avons besoin de débats sérieux, basés sur des données fiables… données qui manquent cruellement aujourd'hui. C'est sur ce point qu'il faudrait se battre !
Les préoccupations traditionnelles concernant l’IA – remplacement de la main-d’œuvre, sécurité, éthique –, bien qu’importantes, ne tiennent pas compte de la manière plus profonde dont ces systèmes transforment notre relation avec la réalité elle-même. Il ne s’agit pas seulement d’outils susceptibles d’être utilisés à mauvais escient ; ce sont des moteurs de génération de réalité qui modifient la manière dont nous vivons et vérifions la vérité.
PARTICIPE !
On construit cette lettre ensemble !
Nous avons passé le cap des 34.000 abonnés !
La dernière édition sur “ChatGPT aprés la retraite”, vous a beaucoup plu et touché, 98,6% d’avis positifs ! Merci !

Alors puisque c’est le sujet du jour, j’ai demandé à ChatGPT Images de générer une joile infographie avec les données du sondage. Bon, il a un peu du mal à respecter les proportions mais on le pardonne parce que les emojis sont cool.
J’ai reçu énormément de témoignages, parfois trés longs, très personnels, et ça me confirme qu’il y a quelque chose à faire pour les séniors.
J’ai demandé à Claude de sélectionner les 30 témoignages les plus intéressants, il m’a produit ce tableau de bord interactif. Tu peux le retrouver ici.
En voici deux :
Cette lettre m'a beaucoup touchée. Je viens de perdre ma mère frappée par Alzheimer et la question de la mémoire me taraude. Je me disais qu'il me fallait interroger les personnes qui l'ont connue dans sa jeunesse. Je n'ai pas eu le temps de lui poser des questions avant que la maladie n'effrite sa mémoire et c'est un grand regret.
Bonjour l'équipe, quelle prouesse mais quel dommage. La fascination pour l'IA et son potentiel me déçoit parfois. Super ce que peut faire l'IA avec les récits de vie, c'était intéressant et j'y vois des usages potentiels. Mais voilà quand tu parles de la problématique de la solitude des seniors, quand tu parles de transmission de récit de vie et que l'outil proposé est un exercice solitaire avec l'IA…
On a encore besoin d’un peu de réflexion avant de se lancer dans une application commercialisable pour écrire ses mémoires avec l’IA. Depuis ma lettre, des abonné(e)s m’ont fait passer trois projets français qui proposent une expérience similaire. Je te propose de les explorer ici et de me dire ce que tu en penses. Et si tu estimes que ça vaut le coup que l’on construise quelque chose de spécifique ensemble, en mode collaboratif.
En attendant, je m’attelle la semaine prochaine au projet d’écriture d’un manuel “ChatGPT après la retraite”. Je te tiendrai au courant de son avancée et je suis preneur des questions que tu voudrais voir abordées !
Alors…
A toi de voter !
Comment as-tu trouvé cette édition ? Vote ici et laisse tes commentaires pour nous aider à nous améliorer !
Comment as-tu trouvé cette édition ?Vote et laisse un commentaire pour nous aider à nous améliorer ! |
Merci de nous avoir consacré un peu de ton temps. Je te souhaite une bonne semaine pleine de belles images !
🎨 Benoit, Thomas et FlintGPT.