<aside> 📌 10/07/2023: Tras una filtración del modelo compartido para investigación, Stability AI ha decidido compartir oficialmente SDXL 0.9.
Los archivos del modelo ya están disponibles en Hugging Face
Para utilizar estos archivos con una versión adaptada de automatic1111, siga las instrucciones de este vídeo:
https://www.youtube.com/watch?v=eg54fIOHlBU
</aside>
Siempre es emocionante ver la aparición de nuevas tecnologías que amplían los límites de lo posible, y uno de esos desarrollos recientes es el lanzamiento Stable Diffusion XL, una nueva e importante actualización del modelo de generación de imágenes basado en IA de Stability AI
Stable Diffusion XL 0.9 destaca por su capacidad para generar imágenes de alta calidad a partir de descripciones de texto, una característica que podría tener importantes implicaciones en ámbitos que van desde el diseño gráfico a la realidad virtual. Sin embargo, como cualquier tecnología, no está exenta de retos y limitaciones.
ssstwitter.com_1687519043789.mp4
<aside> 🎨 ¿Dónde y cómo utilizar Stable Diffusion XL 0.9?
Lanzada en el verano de 2022, stable Diffusion fue desarrollada por investigadores del grupo CompVis de la Universidad Ludwig Maximilian de Múnich y Runway, y financiada por Stability AI.
Stable Diffusion es un modelo de difusión latente, un tipo de red neuronal generativa profunda. Su código y los pesos del modelo se han hecho públicos, y puede ejecutarse en la mayoría de los equipos de consumo equipados con una GPU modesta con al menos 8 GB de VRAM. Esta es una gran diferencia con respecto a los anteriores modelos propietarios de conversión de texto en imagen, como DALL-E y Midjourney, a los que solo se puede acceder a través de servicios online.
En octubre de 2022, Stability AI recaudó 101 millones de dólares en una ronda de financiación liderada por Lightspeed Venture Partners y Coatue Management.
Tras una versión 2 que recibió una tibia acogida a principios de este año, se anunció un nuevo modelo, Stable DiffusionXL, que se lanzó en versión Beta en abril de SDXL 0.9 es la nueva versión que sigue a estas pruebas, y llega unas semanas antes del lanzamiento oficial del modelo Stabvle Diffusion XL, 1.
Stable Diffusion XL 0.9, o SDXL 0.9 para abreviar, es la última actualización del conjunto de plantillas de generación de imágenes de Stability AI, y supone un importante paso adelante con respecto a la versión beta anterior, ya que ofrece una calidad de imagen y una composición notablemente mejoradas.
https://www.reddit.com/r/StableDiffusion/comments/14gg97w/some_sdxl_09_images_i_made/
SDXL 0.9 produce imágenes con un nivel de detalle y composición notablemente superior al de su predecesor, debido a un aumento significativo del número de parámetros del modelo. SDXL 0.9 tiene uno de los recuentos de parámetros más altos de cualquier modelo de imagen de código abierto, con un modelo base de 3.500 millones de parámetros y un conjunto de modelos de 6.600 millones de parámetros.
SDXL 0.9 utiliza dos modelos CLIP, incluido uno de los mayores modelos OpenCLIP entrenados hasta la fecha (OpenCLIP ViT-G/14), lo que mejora su capacidad para crear imágenes realistas con mayor profundidad y una resolución superior de 1024x1024.
https://twitter.com/icreatelife/status/1671998236641447937
https://www.reddit.com/r/StableDiffusion/comments/14gnc8g/stormtrooper_having_a_tea_party_sdxl_09/
SDXL 0.9 ofrece una gran cantidad de aplicaciones creativas para imágenes generadas por IA. Tanto si se dedica al cine como a la televisión, la música, los vídeos educativos, el diseño o la industria, SDXL 0.9 tiene algo que ofrecerle. También ofrece una serie de funciones que van más allá del simple texto, entre las que se incluyen la indicación de imagen a imagen (introducir una imagen para obtener variaciones de esa imagen), inpainting y outpainting.
En definitiva, SDXL 0.9 supone un gran avance en la generación de imágenes basada en IA, ya que ofrece una calidad de imagen y una composición inigualables, así como multitud de aplicaciones creativas.
Si te gustan los números, SDXL 0.9 te impresionará.
Una de las principales mejoras de esta versión con respecto a la beta es el aumento significativo del número de parámetros. Para quienes no estén familiarizados con la jerga de la IA, los parámetros son esencialmente la suma de todos los pesos y sesgos de la red neuronal sobre la que se entrena el modelo. Cuantos más parámetros haya, mayor será la capacidad del modelo para aprender y comprender los datos.
SDXL 0.9 tiene uno de los mayores recuentos de parámetros de todos los modelos de imagen Open Source, con un modelo base de 3.500 millones de parámetros y un conjunto de modelos de 6.600 millones de parámetros. Para ponerlo en perspectiva, la versión beta funcionaba con 3.100 millones de parámetros y utilizaba un único modelo. Se trata de un aumento enorme que se traduce en una mejora significativa de la calidad de las imágenes generadas.