Depuis quelques jours, un nouveau genre d'image fait sensation au sein de la communauté des amateurs d'art lié à l'IA et sur les réseaux sociaux. Je fais bien sûr référence à ces paysages et autres images en spirale qui semblent être des illusions optiques.
Tout a commencé avec un post de Ugleh sur Reddit qui a partagé une première image d’un village medieval avec un motif de spirale en mentionnant juste l’usage de QR Monster, un modèle ControlNet mis au point dans la foulée du buzz autours QR Codes Artistique.
Rapidement, l’image s’est retrouvée un peu partout sur les réseaux sociaux et d’autres utilisateur de Stable Diffusion se sont mis à créer des images sur le même principe.
Ugleh a également partagé sa technique et même admis en avoir eu l’idée en consultant une autre image sur Civitai. C’est cette technique, légèrement adaptée, que je vais vous présenter dans ce petit tuto.
https://www.reddit.com/r/StableDiffusion/comments/16ew9fz/spiral_town_different_approach_to_qr_monster/
<aside> ⚡ La version courte et super simple
Cet article décrit comment créer des images avec Stable Diffusion et l’interface Automatic1111. Mais si vous souhaitez juste créer des images sans rien installer, vous pouvez utiliser Illusion Diffusion, un outil en ligne gratuit optimisé pour créer ce type d’image.
</aside>
Pour réaliser nos images, nous allons utiliser l’interface d’Automatic1111 - Vous devez donc soit l’installer, soit avoir accès à une solution en ligne qui utilise cette interface (par exemple GRAVITY Diffus qui a déjà tout le nécessaire installé).
Pour l’installation, vous pouvez suivre nos guides d’installation pour Mac ou pour Windows. Et si vous n’avez jamais utilisé l’interface, un coup d’oeil sur le manuel en francais d’Automatic1111 pourrait vous être utile (même si l’interface reste assez intuitive).
<aside> ⚒️
Automatic ou Forge ? (mise à jour du 11/11/2024)
Depuis la sortie Flux, Automatic1111 a perdu en popularité au profit de Forge qui reprend une interface très similaire mais avec une mise à jour du moteur de génération d’image (rendu compatible avec Stable Diffusion et Flux).
La méthode décrite dans cet article fonctionne également avec Forge - mais n’a par contre pas été testé avec Flux et je vous recommande donc toujours SDXL pour générer ce type d’images.
</aside>
Nous allons utiliser l’extension sd-webui-controlnet - Cliquez ci-dessous pour dérouler les étapes de son installation si nécessaire :
Nous aurons encore besoin du modèle QR Monster pour appliquer l’effet voulu. Rendez-vous sur sa page HuggingFace et téléchargez le fichier .safetensor dans l’onglet Files and versions. (Les images de @Ugleh utilisent la version 1 mais vous pouvez également utilisez la v2 disponible dans le répertoire v2)
Placez ensuite le fichier télécharger dans le répertoire models/ControlNet
de votre installation ControlNet.
Maintenant que vous avez tous les éléments nécessaires installé, nous allons pouvoir générer nos images en spirales.
La technique est en fait assez simple. Il s‘agit d’appliquer un ControlNet à une génération d’image à partir d’image en noire et blanc (la spirale) et une force relativement basse. Elle peut se résumer en quelques étapes simples à suivre dans l’interface d’Automatic1111.