Les outils d’intelligence artificielle générative (IAG) font beaucoup parler d’eux depuis la mise à disposition de ChatGPT au grand public en novembre 2022.  L’année 2022 fut aussi celle de l’apparition de DALL-E 2, cousin de ChatGPT dédiée à la génération d’images via l’intelligence artificielle.

Depuis, ce paysage s’est largement enrichi avec l’arrivée de centaines de solutions, avec tout autant de promesses. Ces logiciels proposent de créer des contenus à partir de commandes textuelles qui peuvent être de plusieurs formes : texte, code, son, image, vidéo, 3D… Nous vous en proposerons une sélection.

Dans cet article, nous vous proposons de découvrir et d’expérimenter des solutions qui vous permettront de générer et éditer des images.

Il est possible d’obtenir des styles très variés : photoréaliste, dessin, peinture, illustration, rendu 3D…

 

Ci-dessous un exemple de variations de styles avec un même outil de génération d’image :

Commande textuelle (prompt) utilisée : Captivating background, Alpine mountains in the background, painting, book cover, with shadows and effects that make the drawing captivating, super detailedImage générée via StableDiffusion
Commande textuelle (prompt) utilisée : Captivating background, Alpine mountains in the background, photography, with shadows and effects that make the photography captivating, super detailedImage générée via StableDiffusion

 

Tout au long de cet article, nous allons régulièrement parler de « modèles ». Le modèle est le système d’intelligence artificielle qui permet à ces outils de créer des images, en quelque sorte leur « moteur ».

 

Comment fonctionnent ces outils d’intelligence artificielle générative

Toutes les solutions que nous allons évoquer partagent le même fonctionnement : elles interprètent des commandes textuelles pour générer des visuels.

Ces commandes textuelles sont communément appelées « prompt » et ne sont rien de plus qu’une description de l’image attendue.

 

La vidéo ci-dessous illustre ce processus de création en temps réel. Un court temps de calcul est nécessaire pour générer plusieurs propositions d’images.

 

Dans cette vidéo ainsi que pour les autres exemples, les prompts utilisés sont rédigés en anglais. Les outils peuvent aussi générer des images via des commandes en français, mais les résultats sont souvent meilleurs dans la langue de Shakespeare.

 

N’hésitez pas à utiliser un outil de traduction en ligne tel que Deepl ou Google Traduction pour préparer vos prompts.

Si la création d’images via l’écriture de prompt est l’utilisation la plus courante, d’autres existent et peuvent vous aider dans votre création de contenus.

 

Générer des images à partir d’une image existante accompagnée d’un prompt

 

Exemple ci-dessous avec l’outil Pikaso de Freepik : il permet de créer des images à partir de dessins simplifiés accompagnés de prompts.

L’IA interprète à la fois le dessin et la phrase pour proposer un résultat. Si je déplace un élément sur le dessin, elle adaptera le résultat obtenu.

Démo du logiciel Pikaso de Freepik

 

Modifier une image existante à partir de prompt 

Les outils payants présentés ci-dessous permettent d’aller plus loin que la création d’image. Il existe plusieurs types d’opérations :

  • En agrandissant l’image existante, on parlera alors d’image « extender » ou d’«outpainting »
  • A l’intérieur de l’image existante, on parlera alors d’« inpainting »,

 

Image originale non générée par IAImage après agrandissement « outpainting »Image après modification « inpainting »
Image originale non générée par IAImage après agrandissement « outpainting »Image après modification « inpainting »

Outil utilisé pour ces éditions : Runwayml.

 

Nos conseils pour écrire des prompts efficaces

La clé du succès dans la génération d’image par intelligence artificielle réside dans la formulation d’un prompt efficace.

Les phrases que vous utilisez doivent être précises, en définissant votre sujet mais aussi son contexte et le style attendu.

 

Votre sujet : ne vous contentez pas de préciser « un homme » ou « une maison ». Vous obtiendrez des résultats bien plus intéressants avec des sujets tels que « un homme d’âge mur avec des lunettes de vue » ou « une maison moderne de style scandinave ».

Votre contexte : il doit déterminer dans quel cadre se situe votre sujet. Ce cadre peut être de plusieurs ordre : arrière-plan, contexte, époque.

Votre style : il peut faire référence au type de rendu (photographique, dessin, peinture…), aux couleurs utilisées, à un éclairage, à un angle de prise de vue ou encore à un style d’un artiste connu.

 

En reprenant les éléments évoqués, ci-dessous quelques exemples réalisés avec le Créateur d’image Microsoft Bing :

 

Prompt utilisé : a house in the woods (une maison dans les bois)

Résultat obtenu : l’IA génère un visuel avec un rendu d’illustration d’un chalet en bois dans une forêt de sapin car elle estime que c’est ce contexte qui est le plus courant.

Image générée via Dreamstudio qui représente un chalet dans la montagne

 

Prompt utilisé : a modern Scandinavian-style house with large windows and a swimming pool in the middle of a pine forest (une maison moderne style scandinave avec de grandes fenêtres et une piscine au milieu d’une forêt de pins)

Résultat obtenu : en ajoutant des éléments, l’IA génère un visuel avec un rendu plus spécifique en adaptant le sujet et son contexte.

Image généré par IA qui représente une maison moderne style scandinave avec de grandes fenêtres et une piscine au milieu d'une forêt de pins.

 

Prompt utilisé : a modern Scandinavian-style house with large windows and a swimming pool in the middle of a pine forest, sunset, drone view, photorealistic (une maison moderne style scandinave avec de grandes fenêtres et une piscine au milieu d’une forêt de pins, soleil couchant, vue de drone, photoréaliste)

Résultat obtenu : le visuel obtenu est encore plus spécifique grâce aux paramètres de style (soleil couchant vue de drone, photoréaliste).

Image générée via Dreamstudio qui représente une maison moderne dans un forêt de pins

 

Pour vous aider à rédiger des prompts pour vos images vous pouvez utiliser ChatGPT, Microsoft Copilot (Bing Chat) ou Google Bard qui sont d’excellents assistants pour cette tâche.

Enfin, lorsque vous avez « une formule qui marche », n’hésitez pas à la conserver dans un document qui vous permettra d’enregistrer vos prompts et de les réutiliser à l’avenir.

Au-delà de ces conseils généraux, chaque outil dispose de ses propres règles. N’hésitez pas à rechercher des tutoriels et articles en ligne dédiés au logiciel que vous utilisez.

 

Une sélection d’outils d’intelligence artificielle générative pour la création d’images

L’offre est désormais très complète et il ne se passe pas une semaine sans qu’un nouveau générateur d’image ne fasse parler de lui !

De nombreux articles sont déjà disponibles sur le web si vous souhaitez découvrir des listes de modèles. Le Blog du Modérateur vous propose sa liste de générateur d’images par IA, tout comme Codeur ou encore LEPTIDIGITAL.

Nous vous proposons de mieux comprendre ce paysage d’outils en identifiant différentes catégories de solutions.

 

Les solutions gratuites les plus simples

Ces outils vous permettent de générer des images dans une interface web via l’écriture de prompts. Les images que vous générez seront publiques, et pourront être réutilisées.

Pour une utilisation gratuite, il vous faudra créer un compte sur le site en question et vous limiter à un nombre de générations quotidiennes, hebdomadaires ou mensuelles.

Pour découvrir comment fonctionne l’IA et faire vos premières productions, ces outils seront parfaits !

  • Le Créateur d’image Microsoft Bing est le seul qui dispose d’une interface en Français. Il exploite le modèle de génération DALL-E 3, créé par OpenAI, la société derrière ChatGPT. C’est certainement l’offre gratuite la plus performante à ce jour.
  • Le site Lexica propose gratuitement son modèle Aperture avec la limite de 100 images générées par mois, avec une importante bibliothèque de modèles pour s’inspirer de prompts existants.
  • Craiyon est un autre outil qui fut un des premiers à proposer une génération gratuite dans une interface web. La société exploite son propre modèle, et se rémunère via des publicités et ses abonnés payants.

 

Des solutions payantes plus avancées

Les solutions payantes évoquées ci-dessous disposent d’offres qui commencent à partir de +/- 10€ mois pour quelques centaines de génératives d’image. La quantité d’image qu’il est possible de générer peut varier en fonction des modèles utilisés, du format d’image souhaité…

Ces outils ont davantage de possibilités : formats d’images (carré, portrait, paysage…), résolutions plus élevées, réglages plus fins… Ils permettent également d’effectuer de l’inpainting et de l’outpainting.

Celui qui a le plus fait parler de lui est certainement Midjourney. Développé par la société du même nom, il dispose du modèle qui offre les rendus photoréalistes les plus impressionnants à ce jour.

L’utilisation de Midjourney passe par la plateforme de messagerie Discord et les images sont générées dans des canaux de discussions. Si vous souhaitez aller plus loin, Futura Sciences a rédigé un tuto qui vous guide pas à pas.

L’alternative open-source à Midjourney la plus populaire est Stable Diffusion. Ce modèle est développé par la société Stability.ai et peut être utilisé directement dans un navigateur.

Vous trouverez en ligne plusieurs services (voir ici ou ) qui vous permettront d’utiliser gratuitement Stable Diffusion. Néanmoins, pour bénéficier des dernières versions du modèle et de davantage d’options, l’éditeur propose son outil en ligne nommé Dreamstudio.

Pour les plus geeks d’entre vous, sachez qu’il est possible d’installer gratuitement Stable Diffusion sur votre PC pour générer des images, pour peu que vous disposiez d’une carte graphique adéquate.

Enfin, si vous disposez de l’offre payante « plus » de ChatGPT, vous pouvez générez des images via le modèle DALL-E 3 directement via ChatGPT. En discutant avec l’IA pour affiner votre prompt et générer des variantes, vous obtiendrez plus facilement des résultats exploitables que via l’outil gratuit de Microsoft qui exploite le même modèle.

 

Les kits de design graphique assisté par IA

Au-delà des générateurs d’images se développent de véritables boîtes à outils de design graphique propulsées par l’IA générative. Ces offres intègrent des générateurs d’images et des outils associés à la création visuelle (détourage, création de variantes d’images…), ainsi que d’autres dédiées à la vidéo, au son ou encore à la 3D.

Si les offres de Clipdrop et Runwayml sortent du lot, la solution française PhotoRoom propose une offre intéressante dédiée à l’image.

 

Et l’IA dans vos outils existants ?

Petit à petit, les éditeurs intègrent dans leurs logiciels des outils de création assistés par l’IA générative. Il est difficile d’évaluer ces solutions de façon générale tant leurs fonctionnalités et leurs performances sont diverses, n’hésitez pas à comparer la qualité des résultats avec les solutions évoquées ci-dessus !

A titre d’exemples, quelques-unes de ces solutions :

  • Canva dispose d’un générateur directement intégré à sa solution en ligne,
  • Photoshop dispose d’un générateur et d’outils d’édition « inpainting » et « outpainting »,
  • L’outil d’édition d’image en ligne Pixlr intègre également la création d’image par prompt.

 

Enfin, une multitude outils spécialisés font leur apparition, en proposant souvent une approche dédiée à un secteur : visuels de produits (e-commerce), visuels d’architecture, portraits, etc.

Des sociétés proposent également de vous personnaliser un modèle d’IA à partir d’une collection de vos visuels pour vous permettre de disposer d’outils sur-mesure.

 

Peut-on utiliser librement des images générées par une intelligence artificielle ?

Les droits d’utilisations des images générées sont propres aux licences de chaque outil. Nous vous recommandons d’observer les éléments indiqués sur le site de l’éditeur en question.

De façon générale, les licences sont assez permissives et vous cèdent l’intégralité des droits, y compris pour des usages commerciaux.

Le statut juridique des images créées reste toutefois assez incertain à ce jour et rien ne garantit que vos images puissent être protégées par le droit d’auteur.

Il conviendrait également d’indiquer dans vos crédits associés aux images qu’elles ont été générées par IA.

L’entrée en vigueur de la nouvelle règlementation européenne sur l’intelligence artificielle dite « AI Act » devrait permettre de clarifier prochainement ces zones de flou juridique.

Si vous êtes une entreprise de la région Auvergne-Rhône-Alpes, avec un projet web ou numérique, vous pouvez bénéficier du programme d’accompagnement régional Atouts Numériques. N’hésitez pas à remplir le formulaire pour adresser votre demande, et vous serez mis en relation avec un conseiller proche de chez vous.

Sommaire

Partager cet article

Sur le même thème