Les 6 meilleurs outils de génération d'image avec l'IA

Midjourney, Dall-E 3, Stable Diffusion, Adobe Firefly, Ideogram, LensGo... quel outil pour quel usage ?

Les outils de génération d’image par l’intelligence artificielle entrent dans une phase de maturité.

Avec l’arrivée d’un nouveau venu : LensGo, qui impressionne par la qualité de ses rendus et son interface hyper-simple.

Je vous propose un petit récapitulatif des meilleurs outils du moment, et quelques recommandations d’usage…

Le modèle le plus célèbre et le plus avancé à ce jour.

Les plus :

  • Grande qualité d’images, bon rendu des détails physiques comme les mains

  • Possibilité d’éditer l’image (zoomer, élargir le plan, éditer une partie de la photo).

  • Possibilité d’utiliser des photos comme modèle, de fusionner des images, ou de créer une image à partir d’une ancienne image générée

  • Fonction de description

  • Nombreux paramètres (mais demande une bonne connaissance des codes à insérer dans ses instructions)

  • Grande communauté (beaucoup de tutoriels et d’astuces)

Les moins :

  • Pas de version gratuite

  • Accès difficile (il faut passer par la plateforme Discord)

  • Les images sont publiques par défaut (mais on peut le régler)

Tarif : 10$/ mois (pour 200 images par mois)

2. DreamStudio (Stable Diffusion)

Le concurrent Opensource le plus célèbre du web !

Les plus

  • Interface facile d’accès

  • Grande qualité d’images, bon rendu des détails physiques comme les mains

  • Possibilité d’éditer l’image (éditer une partie de la photo ou au delà).

  • Possibilité d’utiliser des photos comme modèle, ou de créer une image à partir d’une ancienne image générée

  • Possibilité d’utiliser l’API pour le connecter à vos applications

  • Possibilité d’utiliser des negative prompts (ce que vous ne voulez pas), de donner plus ou moins de liberté à l’IA, de choisir la dimension (comme Midjourney, mais on peut le faire plus simplement avec l’interface)

  • Open Source (c’est à dire que le code est public et peut être modifié)

  • Grande communauté (beaucoup de tutoriels et d’astuces)

Les moins

  • Encore quelques bugs et imprécisions (dans l’éditing par exemple)

  • Qualité moins bonne que Midjourney (mais c’est relatif)

  • Beaucoup de paramètres, mais difficile à maitriser

  • Communauté très “tech”.

Tarif : 10$ pour 5000 images

3. Dall-E 3

Le nouveau modèle d’OpenAI (créateur de ChatGPT) !

Les plus

  • Intégration dans ChatGPT (permet d’améliorer l’image en conversant avec ChatGPT)

  • Interface très simple d’utilisation (ChatGPT)

  • Grande qualité d’images (à peu près équivalente à Stable Diffusion)

  • Possibilité de générer du texte (court)

  • Possibilité de créer une image à partir d’une ancienne image générée

  • Respect des droits d’auteur dans la génération d’images (on ne peut pas s’inspirer du style d’un artiste en deça de 100 ans) et du droit l’image (on ne peut pas générer des personnalités)

Les moins

  • Respect des droits d’auteur et du droit à l’image : moins de diversité et de souplesse dans la création.

  • Pas d’édition (on peut recréer une image mais pas l’éditer)

  • L’instruction est re-générée par ChatGPT sur la base de votre instruction (c’est un plus et un moins : ChatGPT améliore le prompt mais donne moins de liberté)

Tarif : 20$/ mois (compris dans l’abonnement à ChatGPT Plus) ou gratuit via Bing.

Un nouveau challenger !

Les plus

  • Grande qualité d’images (un peu moins bonne que Stable Diffusion)

  • Possibilité de créer des modèles de personnages à partir de photos (minimum 8)

  • Possibilité de créer des petites vidéo à partir de ces modèles (pas toujours optimal)

  • Possibilité d’utiliser des photos comme base pour la création

  • Interface très simple d’utilisation

  • Pas de censure (même pour les images érotiques)

Les moins

  • Pas de possibilité d’éditer les photos

  • La qualité des images générées à partir de modèles est encore faible et remplie de bruits

  • La fonction vidéo est encore très gadget

Tarif : 10$/ mois (pour 200 images par mois)

La combinaison de la puissance de Photoshop et de l’IA générative.

Les plus

  • Bonne qualité d’images (mais moins bonne que les précédents outils)

  • Possibilité d’éditer des images (basique et instable) ou de remplir automatiquement certaines parties de l’image

  • Outils vectoriel (pas testé encore)

  • Création de polices de caractères

  • Respect des droits d’auteur dans la génération d’images et du droit l’image (on ne peut pas générer des personnalités)

  • Fonctionnalités intégrées dans Photoshop et Illustrator

Les moins

  • Usages très larges, donc moyen en tout (plutôt intéressant pour retravailler une image)

  • Respect des droits d’auteur et du droit à l’image : moins de diversité et de souplesse dans la création.

  • La fonction de remplissage est parfois décalée par rapport à l’image de base

Tarif : gratuit

Le petit frère de la famille des IA génératives !

Les plus

  • Interface très facile et très fun à prendre en main

  • Résultats rapides

  • Possibilité de générer du texte (court)

  • Possibilité de choisir un type de création (poster, logo etc)

  • Plus orienté graphisme que photo (c’est un plus et un moins !)

  • Possibilité de créer une image à partir d’une ancienne image générée (plutôt bon).

Les moins

  • Qualité d’image inférieure aux modèles précédents

  • Images publiques (mais ça permet de voir les créations des autres)

Tarif : gratuit

BONUS : Remini

Une application mobile pour améliorer ses photos (et vidéo) et pour les transformer (photos uniquement) ! Ce n’est pas exactement une IA générative d’images, même si elle peut s’inspirer de photos pour créer des avatars.

Je l’utilise régulièrement pour améliorer mes photos et les retoucher. Et parfois pour les transformer dans un nouveau style.