Comment créer des personnages persistants avec Dall-E 3

Apprenez à maîtriser le 'seed' dans Dall-E 3 pour créer des personnages persistants. Un guide pour ceux qui veulent plus de cohérence dans leurs créations visuelles.

On le sait les générateurs d’images ont du mal à récréer le même personnage, même avec la même description (prompt).

Cela peut-être utile si vous voulez faire une BD ou retrouver un même personnage dans une communication.

Jusque là c’était très compliqué. Si par exemple vous voulez générer plusieurs images avec le même personnage dans différentes expressions ou situations, c’est quasi-impossiblen (ou trèèès long et compliqué). Et c’est normal puisque le générateur ré-invente l’image à chaque fois avec une part d’aléatoire.

Mais il y a un moyen.

Il faut utiliser le “seed”. Le “seed” est la racine de l’image créée avec un prompt.

Parfois l’appel au “seed” peut ne pas fonctionner. Une alternative est de demander le “gen_id” de l’image.

(Mise à jour 15/11/2023)

Mais ça ne suffit pas.

Si vous utilisez le même prompt avec le même seed, l’image sera identitique.

Mais si vous utilisez le même seed avec un prompt différent, l’image sera différente, mais le personnage aussi.

Le truc est de changer subtilement le prompt (par exemple juste l’expression du visage) tout en gardant le même seed.

Comment faire ça ?

  1. Aller sur ChatGPT Plus (c’est à dire la version payante), cliquer sur GPT-4 et sélectionner Dall-E 3.

  2. Générer une image. Par exemple :

Portrait étonnant d'une femme pirate balinaise aux cheveux noirs, capturé lors d'une séance photo en studio avec une lumière naturelle pour mettre en valeur ses traits distinctifs. Chapeau pirate avec un jolly-roger blanc dessus. Veste de pirate noire et rouge en cuir et tissu.

Le prompt n’a pas a être structuré, ChatGPT va reformuler le prompt en anglais pour Dall-E 3. Mais il est importat de tenir compte des contraintes suivantes : décrire les vêtements (couleur et matière, ou détails), couleur des yeux et des cheveux si le personnage est peu typé (mais il peut être nécessaire tout de même de préciser les particularité du type recherché, couleur de peau par exemple, ou structure du visage, pour éviter les clichés).

Voici le résultat :

Maintenant, il faut récupérer le prompt reformulé ET le seed de l’image. Choisissons l’image 2.

Maintenant, demandons à ChatGPT :

Quelle est le seed de l’image 2 ?

Le seed est donc 279030043.

Maintenant récupérons le prompt de l’image 2. Il suffit de cliquer sur l’image, le prompt apparaitra à côté. Cliquez sur “copier”.

Maintenant que nous avons le seed et le prompt, faisons un test. Je vais entrer le même prompt, associé au seed. Et vous allez voir que l’image sera identique.

Studio portrait of a woman from Bali with raven-black hair, embodying the persona of a pirate. Illuminated by soft natural light, her unique facial characteristics are emphasized. She dons a pirate hat adorned with a white jolly-roger and is dressed in a black and red pirate jacket made of leather and cloth, seed 279030043

Pour modifier l’expression du personnage tout en gardant le même personnage, il faut modifier très subtilement le prompt et conserver le seed. Si le promt est trop différent, on perd la consistance. Il faut donc tester par petites touches. Ici on rajoute juste “laughing” à la fin, juste avant le “seed”.

Studio portrait of a woman from Bali with raven-black hair, embodying the persona of a pirate. Illuminated by soft natural light, her unique facial characteristics are emphasized. She dons a pirate hat adorned with a white jolly-roger and is dressed in a black and red pirate jacket made of leather and cloth, laughing, seed 279030043

Voilà !

Vous noterez que le costume est le même (à quelques boutons près).

Essayons de lui mettre un violon dans les mains. Même technique, légère variation à la fin du prompt :

Studio portrait of a woman from Bali with raven-black hair, embodying the persona of a pirate. Illuminated by soft natural light, her unique facial characteristics are emphasized. She dons a pirate hat adorned with a white jolly-roger and is dressed in a black and red pirate jacket made of leather and cloth, playing a violin, seed 279030043

La même mais en colère…

Studio portrait of a woman from Bali with raven-black hair, embodying the persona of a pirate. Illuminated by soft natural light, her unique facial characteristics are emphasized. She dons a pirate hat adorned with a white jolly-roger and is dressed in a black and red pirate jacket made of leather and cloth, angry, seed 279030043

Et un petit dernier pour la fin, à la barre d’un bateau pirate !

Studio portrait of a woman from Bali with raven-black hair, embodying the persona of a pirate. Illuminated by soft natural light, her unique facial characteristics are emphasized. She dons a pirate hat adorned with a white jolly-roger and is dressed in a black and red pirate jacket made of leather and cloth, piloting a pirate ship, seed 279030043

Faites vos essais !

(Inspiration : le compte d’Ashutosh Shrivastava sur X (ex-Twitter). Il propose des tas d’astuces pour jouer avec cette fonctionnalité. Compte en anglais.)

Attention. la technique ne fonctionne qu’avec Dalle-E 3, mais pas avec son concurrent Midjourney (qui propose aussi le “seed”…). Il est cependant possible de créer des personnages consistants avec Midjourney, avec d’autres techniqus, même si ça demande souvent beaucoup de pratique. Voici deux tutoriels (ici et ici) qui m’ont été suggéré par Alexis Choron sur LinkedIn Ou cette méthode proposée par Mathieu Crucq.

Les artistes qui sont à l’aise avec Stable Diffusion arrivent à d’excellents résultats mais cela demande de s’y plonger très sérieusement et d’utiliser différents outils. Voici un exemple(lien proposé par Martin Tissier sur LinkedIn)