- Génération IA
- Posts
- Comment créer des images impactantes avec Midjourney grâce à ChatGPT
Comment créer des images impactantes avec Midjourney grâce à ChatGPT
Les IA génératives comme Midjourney sont impressionnantes, mais sans intention humaine, elles restent banales. Apprenez à utiliser ChatGPT pour apprendre à stimuler votre imagination et à créer des visuels exceptionnels.
Depuis que j’utilise les IA génératives, je réalise qu’elles me servent surtout à apprendre.
Quand j’ai commencé à vouloir générer des images impactantes et originales avec Midjourney par exemple je suis allé interroger des artistes pour comprenddre comment ils maitrisaient l’IA.
Et j’ai réalisé que le secret ne résidait pas tant dans l’art du prompt que dans la bonne idée. Laquelle passait par l’enrichissement de la culture visuelle.
Midjourney génère de très belles images, mais elles sont toutes un peu standard. Les IA génératives ne sont que des outils, rien d’intéressant ne peut en sortir (sauf par hasard) sans l’intention humaine.
Pour sortir du banal, il faut aller chercher ailleurs. En soi.
Mais si l’on ne possède pas d’expérience en art ou en photographie, on peut se sentir rapidement bloqué devant son écran blanc. Comment faire ?
Ayant une bonne expérience de ChatGPT, je me suis dit que j’allais utiliser ces compétences pour apprendre à générer des images plus intéressantes.
Il y a plein de manières différentes. L’IA générative est un outil interactif par essence, qu’il s’agisse d’image ou de texte. J’ai donc utilisé ChatGPT pour générer des interactions, stimuler ma curiosité, apprendre de nouvelles choses.
Par exemple, sur la photographie, j’ai réalisé qu’il y avait des millions de manières différentes d’aborder une image. Le tout est de connaitre les bons termes, la multiplicité des approches, la richesse des influences artistiques et techniques pour composer sa propre vision.
J’ai donc commencé à utiliser ChatGPT pour me constituer un catalogue de styles, techniques, artistes, règles de composition, types d’appareils photos, théories des couleurs. Je récupérais ainsi des centaines de petites boîtes de mots dans lequelles je pouvais aller piocher pour mettre en mots la vision que j’avais dans la tête.
J’ai aussi pas mal lu, guidé par l’IA. Par exemple : Camera Lucida de Roland Barthes. Dans lequel il évoque la notion de “punctum”, que j’ai trouvée fascinante.
Selon Roland Barthes, le punctum est un détail dans une photographie qui attire et "pointe" le regard du spectateur, le touchant personnellement. C'est un élément qui n'était pas nécessairement intentionnel de la part du photographe mais qui vient percer, meurtrir, le spectateur en suscitant chez lui un affect, une émotion forte. Par exemple, écrit l’essayiste : "William Klein a photographié les enfants de Little Italy à New York (1954) ; tout cela est très touchant, amusant, mais ce que je m'obstine à voir, ce sont les mauvaises dents d'un enfant. Kertesz, en 1926, a fait le portrait du jeune Tzara (avec un monocle) ; mais ce que je remarque, par cette vision supplémentaire qui est en quelque sorte le don, la grâce du punctum, c'est la main de Tzara appuyée sur le cadre de la porte : une grande main dont les ongles sont tout sauf propres.”
J’ai donc généré plusieurs prompts pour ChatGPT destinés à m’aider dans différentes étapes de la création d’images : trouver la bonne idée, faire émerger une image mentale, transformer un concept en image.
Celui dont je suis le plus content, permet justement de générer un prompt Midjourney à partir d’une idée, en allant justement chercher cette idée de punctum. Et en faisant réfléchir le modèle d’IA par étape.
Ce qui est fascinant dans cet exercice, c’est que la “réflexion” déroulée par ChatGPT m’aide à mieux comprendre la façon dont je peux orienter mon regard pour générer une image plus expressive. ChatGPT crée le prompt à ma place mais ce faisant il m’aide à apprendre.
Voici le prompt (qui marche très bien avec GPT-4 mais encore mieux avec Claude 3):
Agis comme un expert en création de prompt pour les IA génératives d'images, titulaire d'un doctorat en intelligence artificielle et arts numériques. Tu possèdes une excellente culture visuelle et une vaste expérience dans la formulation de prompt qui génèrent des images visuellement stupéfiantes et conceptuellement profondes.
Tu es reconnu pour ta compréhension nuancée de la manière dont les mots influencent la création visuelle de l'IA, combinant habilement créativité artistique et technologie. Tes prompt sont célèbres pour avoir produit des images qui ont été exposées dans des galeries numériques et acclamées pour leur originalité, esthétique, pertinence culturelle et réalisme photographique.
J'ai besoin que tu rédiges un prompt pour l'IA générative d'images Midjourney à partir de mon idée.
Pour que cette image soit parfaite, et génère de l'émotion, tu dois réfléchir à son punctum.
Voici la <définition> du punctum :
<définition> Selon Roland Barthes, le punctum est un détail dans une photographie qui attire et "pointe" le regard du spectateur, le touchant personnellement. C'est un élément qui n'était pas nécessairement intentionnel de la part du photographe mais qui vient percer, meurtrir, le spectateur en suscitant chez lui un affect, une émotion forte. Par exemple : "Voici une famille de Noirs américains, photographiée en 1926 par James Van der Zee. Le studium est clair : je m'intéresse sympathiquement, en tant que sujet culturel docile, à ce que la photographie a à dire, car elle parle (c'est une "bonne" photographie) : elle dit la respectabilité, la vie de famille, le conformisme, le dimanche au mieux, un effort de promotion sociale pour assumer les attributs de l'homme blanc (effort touchant par sa naïveté). Le spectacle m'intéresse mais ne me pique pas. Ce qui me pique, bizarrement, c'est la ceinture portée bas par la sœur (ou la fille)
dont les bras sont croisés dans le dos comme une écolière, et surtout ses escarpins à lanières (Mary Janes - pourquoi cette mode datée me touche-t-elle ? Je veux dire : à quelle date me renvoie-t-elle ?) Ce punctum particulier suscite en moi une grande sympathie, presque une sorte de tendresse. Pourtant, le punctum n'a aucune préférence pour la morale ou le bon goût : le punctum peut être mal élevé. William Klein a photographié les enfants de Little Italy à New York (1954) ; tout cela est très touchant, amusant, mais ce que je m'obstine à voir, ce sont les mauvaises dents d'un enfant. Kertesz, en 1926, a fait le portrait du jeune Tzara (avec un monocle) ; mais ce que je remarque, par cette vision supplémentaire qui est en quelque sorte le don, la grâce du punctum, c'est la main de Tzara appuyée sur le cadre de la porte : une grande main dont les ongles sont tout sauf propres." </définition>
Avant cela, questionne en profondeur ce que signifie le punctum et le meilleur moyen de le faire jaillir de l'image. Ecris tes réflexions.
Puis questionne en profondeur le sujet et l'histoire que l'image doit raconter :
- Quel est le cœur du message, l'émotion, l'idée que l'image doit faire passer de manière saisissante ? Quelle réaction cherche-t-on à provoquer chez le spectateur ?
- Quels sont les films, les images, les musiques, qui pourraient t'inspirer pour illustrer cette histoire et quels ingrédients pourrais-tu intégrer pour créer une image saisissante ?
- Quel détail inattendu et poignant pourrait jouer le rôle de punctum, venant percer le regard et susciter une réaction émotionnelle forte, selon le concept de Roland Barthes ?
Ce punctum peut prendre la forme d'un élément a priori anodin (un objet, un geste, une texture, un jeu de lumière...) mais qui, par un effet de surprise et de décalage, vient interpeller, troubler, émouvoir. Réfléchis à la manière dont ce détail pourrait orienter la lecture de l'image.
- Quels sont les photographes dont tu pourrais t'inspirer pour générer cette image expressive ? Quellles techniques ou approches pourrais-tu utiliser pour donner à ton image une expression et une émotion unique ?
- Au delà du sujet principal, quels autres éléments de composition pourraient, de manière subtile, appuyer le propos et renforcer l'impact émotionnel ? Pense au cadrage, aux lignes de force, à la profondeur de champ, aux contrastes...
- Quel traitement serait le plus à même de servir le sens et l'émotion recherchés ? Quel rendu de lumière, quelles couleurs ou absence de couleurs renforceraient le punctum ?
- Comment rendre cette photo encore plus perçante, originale ?
Maintenant, rédige un prompt en anglais de moins de 100 mots pour MidJourney répondant à ces questions et respectant cette structure :
1. Sujet et éléments clés de l'image
2. Détail inattendu jouant le rôle de punctum (ne cite pas le mot "puctum" dans ton prompt final)
3. Type d'image (photo documentaire, fine art photography, illustration etc)
4. Composition, style, rendu visuel (composition lumière, appareil photo utilisé, couleurs...)
Le prompt doit être à la fois précis et évocateur pour guider l'IA vers une image proche de l'intention originelle, tout en laissant une part d'ouverture et d'interprétation pour faire émerger ce fameux punctum.
N'hésite pas à utiliser un vocabulaire riche et imagé pour stimuler la créativité de l'IA. Vise un équilibre entre contrôle et surprise.
Voici deux exemples de prompts en anglais pour Midjourney :
<exemples>
1. Intimate close-up portrait of a man with a bittersweet expression, staring pensively into the camera, face etched by life experiences, eyes reflecting a complex soul, visible skin imperfections and details like wrinkles and scars, natural directional light sculpting the face, leading lines from the environment converging towards the subject, shallow depth of field, slightly low angle perspective, as if shot on Kodak Tri-X 400 black and white film with deep blacks, high contrast and prominent grain, subtle motion blur and vintage analog feel
2. Uplifting portrait of an authentically smiling woman in a male-dominated environment. Her vulnerable strength illuminating the scene, genuine grin contrasting with reserved masculine expressions, convergent gazes expressing curiosity and respect, central feminine presence federating the group, soft warm tones emanating from the subject and subtly spreading to her surroundings. Fine Art photography. Broken Rules. Gentle diffused light creating an atmosphere of understanding and benevolence, harmonious and inspiring composition celebrating the power of embraced femininity. Shot by Annie Leibovitz with Hasseblad X1D. Colors : shades of grey.
</exemples>
Demande moi quelle est mon idée et réfléchis à ce problème étape par étape.
Par exemple, je lui ai donné cette idée : “Une femme dans un milieu d'hommes. C'est le portrait d'une femme "puissante", une image positive”.
ChatGPT s’est alors mis à explorer diverses sources d’inspiration avant de s’intéresser à ce qui pourrait générer le fameux punctum, le déclencheur émotionnel.
Au final, la façon dont l’IA va dérouler le sujet et construire son image est aussi intéressante que le résultat final. Ça aide à réfléchir. Je comprends pourquoi ChatGPT me propose tel prompt, telle composition, telle influence, pour telle image. On découvre aussi, au fil des essais, certains biais du modèle.
Je l’ai relancé ChatGPT plusieurs fois pour générer plusieurs approches différentes, et je les ai toutes entrées dans Midjourney.
Une fois que l’on a les premières images, il est intéressant de les re-générer, ou de demander des variations. On peut aussi ajouter des éléments dans le prompt comme un type d’appareil photo, ou l’influence d’un photographe. On peut aussi le mélanger à un style d’image pour voir ce que ça donne.
Le punctum émerge souvent par accident.
C’est ensuite votre oeil qui fait le choix.
Les images que j'ai obtenues étaient plus saisissantes. Très améliorables bien évidemment, mais j'apprends et je progresse à chaque fois. Parce que mon regard s'affine, ma compréhension de la richesse des possibles s'amplifie.
Ça m'a même donné envie de me remettre à la photo. Quand je prenais mes premiers cours de photo, mon prof me disait : si tu veux apprendre à faire de la photo, fais des photos. Et regarde aussi des photos.
Si on veut apprendre à faire des images avec l’IA, il faut s’y mettre quotidiennement, et nourrir son oeil. Par chance, les IA sont des trésors sans fond pour nous aider à nous enrichir.
Pour aller plus loin…
Pour ceux qui veulent aller plus loin dans la maîtrise de Midjourney et la création d'images impactantes, je vous invite à découvrir notre nouvelle formation (avec un petit cadeau) : Midjourney 6 - De zéro à... Wow ! J'y partage mon expérience personnelle avec cette technologie, les défis rencontrés et les solutions créatives que j'ai développées.
Masterclass avec Caroline Zeller qui t’emmène devant son écran pour t’apprendre à prompter…
En bonus, dans la formation, deux masterclass exclusives d’une heure avec deux artistes : Thierry Murat (un illustrateur chevronné qui a réalisé la première BD avec l’IA en 2023) et Caroline Zeller (à qui Google a demandé de réaliser une image d’art pour son 25ème anniversaire), qui m’ont accompagné avec bienveillance tout au long de mes recherches.
Voici quelques premiers résultats sur la thématique “femme puissante au milieu d’hommes”.
Portrait of a resilient woman standing confidently amidst a blur of men in the background, her power emanating from vulnerability. Focus on a delicate yet firm grasp on a symbolic flower, showcasing strength through resilience. Professional attire with a personal touch, soft natural lighting highlighting her determined expression, warm tones enveloping the scene. Photorealistic with a hint of surrealism in the punctum, capturing a story of quiet power and dignity --ar 4:3 --style raw --stylize 0
Photograph capturing a powerful woman confidently standing her ground in a male-dominated environment, her resilience and vulnerability her greatest strengths. Her attire is elegant, symbolizing professionalism and grace. The focus is on her determined, serene expression and direct gaze that seems to pierce through the viewer, conveying strength and depth. The men around her, blurred and in the background, emphasize her prominence. The color photograph with shallow depth of field highlights her while subtly suggesting the surrounding male presence. Inspired by photojournalistic portraits, the lighting accentuates her face, especially her eyes, creating a vivid contrast against a darker, indistinct background, illustrating her unique power and beauty stemming from her resilience, shot by David Lachapelle with Hasselblad X1D --ar 4:3 --style raw --stylize 0
Capture of a resilient woman standing confidently among men, embodying powerful vulnerability. Her gaze, soft yet unwavering, serves as the punctum, juxtaposing the harsher environment. Surrounding lines subtly guide to her, highlighting her central role. The composition celebrates her influence with a halo of gentle light focusing on her, amidst a backdrop of softer-focused masculine presence. Rendered in fine art photography style, emphasizing warm, subdued colors that emanate from her and influence her surroundings, embodying strength through vulnerability. A narrative of change and positivity in a male-dominated space --ar 4:3 --style raw --stylize 0
Ou sur cette idée : “Portrait d'un homme et d'une femme. Un secret caché entre eux."
Close-up photograph of a man and a woman sharing a secretive moment, their faces near yet expressions vastly different—his bearing the weight of secrecy, hers oddly light. Subtle clues like a crumpled handwritten letter and a small, symbolic exchanged object hint at the undisclosed secret between them. Black and white to capture the timeless, cinematic feel of the 1940s and 1950s, with dramatic lighting creating expressive shadows and highlighting the emotional tension. Style evokes a deep, emotional narrative through the use of grayscale nuances, mirroring the complex layers of their untold story --ar 4:3 --style raw --stylize 0
Close-up photograph of a man and a woman sharing a secretive moment, their faces near yet expressions vastly different—his bearing the weight of secrecy, hers oddly light. Subtle clues like a crumpled handwritten letter and a small, symbolic exchanged object hint at the undisclosed secret between them. Black and white to capture the timeless, cinematic feel of the 1940s and 1950s, with dramatic lighting creating expressive shadows and highlighting the emotional tension. Style evokes a deep, emotional narrative through the use of grayscale nuances, mirroring the complex layers of their untold story --ar 4:3 --style raw --stylize 0