Stable Diffusion 3.5 est la dernière version des modèles de génération d'images développée par Stability AI, marquant un retour remarqué de l'entreprise pionnière de l'IA open source.
Cette suite de modèles optimisés excelle dans la fidélité aux prompts et la personnalisation, offrant des performances de haut niveau tant sur les infrastructures professionnelles que sur le matériel grand public.
Fidèle à sa philosophie d'accessibilité, stable Diffusion 3.5 est partagé avec une licence communautaire permettant un usage gratuit pour la recherche et les petites entreprises.
<aside> ⭐
</aside>
<aside> 🗞️
15/02/25 - L’AI Foundry de Microsoft Azure intégre désormais Stable Diffusion 3.5 Large. → En savoir plus
23/12/24 - AWS Bedrock intégre désormais Stable Diffusion 3.5 Large. → En savoir plus
</aside>
Stable Diffusion 3.5 est la nouvelle génération de modèles d'IA texte-image lancée par Stability AI le 22 octobre 2024. Ce n'est pas un modèle unique, mais une famille de plusieurs modèles conçus pour différents besoins.
Ces nouveaux modèles sont plus personnalisables, performants et polyvalents que leurs prédécesseurs.
Ils excellent dans la création d'images diverses, représentant mieux la variété du monde réel, sans nécessiter de prompts détaillés. De plus, ils sont capables de générer un large éventail de styles artistiques, de la photographie à l'art 3D.
Stable Diffusion 3.5 n’est actuellement pas supporté par Forge ou Automatic1111 et l’interface reccomandée pour l’utiliser localement est donc ComfyUI qui propose même des workflow d’exemples pour s’y mettre facilement.
<aside> 📌
Pour tester et utiliser directement SD3 en ligne, vous pouvez utiliser la demo de fal.ai ou celle de Replicate.
</aside>
Si vous souhaitez installer et utiliser Stable Diffusion 3.5 avec ComfyUI, suivez ces étapes :
La résolution standard de Stable Diffusion 3.5 est de 1024×1024. Comme avec SDXL et Flux, vous pouvez utiliser d'autres rapports de dimensions qui correspondent approximativement à 1M pixels.
Stable Diffusion 3.5 requiert une configuration légèrement supérieure à SDXL. Il est donc recommandé de disposer d’une carte graphique (GPU) disposant d’au moins de 12GB de VRAM. Il n’y a pas encore beaucoup de retour de l’a communauté sur les optimisations possibles pour l’utiliser avec moins de mémoire ou sur des configuration alternative comme une carte AMD ou un processeur Apple Silicon.
Avec une NVIDIA RTX4090 (24GB), la génération d’une image avec Stable Diffusion 3.5 Large prend environ 20 secondes (20 steps).
La version Turbo est évidemment plus rapide et l’image est générée en 10 secondes avec seulement 4 steps.
Voici quelques exemples d’images générées avec Stable Diffusion 3.5
Stable Diffusion 3.5 Large: Il s'agit d'un modèle à 8 milliards de paramètres qui excelle dans l'adhésion rapide et la production d'images de haute qualité, ce qui le rend adapté aux utilisateurs professionnels.
Avec une résolution d’image allant jusqu’à 1 mégapixel, Il est idéal pour créer des images vivantes et des ressources numériques pour les campagnes de marketing et les cas d'utilisation similaires en entreprise