Stable Diffusion 3.5 est la dernière version des modèles de génération d'images développée par Stability AI, marquant un retour remarqué de l'entreprise pionnière de l'IA open source.

Cette suite de modèles optimisés excelle dans la fidélité aux prompts et la personnalisation, offrant des performances de haut niveau tant sur les infrastructures professionnelles que sur le matériel grand public.

Fidèle à sa philosophie d'accessibilité, stable Diffusion 3.5 est partagé avec une licence communautaire permettant un usage gratuit pour la recherche et les petites entreprises.

image.png

<aside> ⭐

SD 3.5

</aside>

<aside> 🗞️

L’Actualité de Stable Diffusion 3.5

azure-sd34.png

SD3.5 Large sur MS Azure

15/02/25 - L’AI Foundry de Microsoft Azure intégre désormais Stable Diffusion 3.5 Large. → En savoir plus

image.png

SD3.5 Large sur AWS Bedrock

23/12/24 - AWS Bedrock intégre désormais Stable Diffusion 3.5 Large. → En savoir plus

</aside>

Qu’est-ce que Stable Diffusion 3.5 ?

Stable Diffusion 3.5 est la nouvelle génération de modèles d'IA texte-image lancée par Stability AI le 22 octobre 2024. Ce n'est pas un modèle unique, mais une famille de plusieurs modèles conçus pour différents besoins.

Ces nouveaux modèles sont plus personnalisables, performants et polyvalents que leurs prédécesseurs.

Ils excellent dans la création d'images diverses, représentant mieux la variété du monde réel, sans nécessiter de prompts détaillés. De plus, ils sont capables de générer un large éventail de styles artistiques, de la photographie à l'art 3D.

image.png

Comment utiliser Stable Diffusion 3.5 ?

Stable Diffusion 3.5 n’est actuellement pas supporté par Forge ou Automatic1111 et l’interface reccomandée pour l’utiliser localement est donc ComfyUI qui propose même des workflow d’exemples pour s’y mettre facilement.

<aside> 📌

Demo en ligne

Pour tester et utiliser directement SD3 en ligne, vous pouvez utiliser la demo de fal.ai ou celle de Replicate.

</aside>

Si vous souhaitez installer et utiliser Stable Diffusion 3.5 avec ComfyUI, suivez ces étapes :

  1. Mettez à jour ComfyUI
  2. Téléchargez Stable Diffusion 3.5 Large ou Stable Diffusion 3.5 Large Turbo dans votre dossier models/checkpoint.
  3. Téléchargez clip_g.safetensors, clip_l.safetensors, et t5xxl_fp16.safetensors dans votre dossier models/clip
  4. Faites glisser le Workflow dans ComfyUI et générez des images !

image.png

Taille d’images

La résolution standard de Stable Diffusion 3.5 est de 1024×1024. Comme avec SDXL et Flux, vous pouvez utiliser d'autres rapports de dimensions qui correspondent approximativement à 1M pixels.

Performances & Besoin Matériel

Stable Diffusion 3.5 requiert une configuration légèrement supérieure à SDXL. Il est donc recommandé de disposer d’une carte graphique (GPU) disposant d’au moins de 12GB de VRAM. Il n’y a pas encore beaucoup de retour de l’a communauté sur les optimisations possibles pour l’utiliser avec moins de mémoire ou sur des configuration alternative comme une carte AMD ou un processeur Apple Silicon.

Avec une NVIDIA RTX4090 (24GB), la génération d’une image avec Stable Diffusion 3.5 Large prend environ 20 secondes (20 steps).

La version Turbo est évidemment plus rapide et l’image est générée en 10 secondes avec seulement 4 steps.

Images créées avec Stable Diffusion 3.5

Voici quelques exemples d’images générées avec Stable Diffusion 3.5

Gaf9HtRbEAEzQUx.jpeg

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

Stable Diffusion 3.5 en détails

Les différentes modèles