Stable Diffusion 3 Medium

El tamaño no siempre lo es todo, especialmente cuando se trata de ejecutar modelos de IA generativa en hardware estándar ,y Stability AI lo ha comprendido con el lanzamiento de Stable Diffusion 3 Medium

La primera versión de Stable Diffusion 3 presentó en primicia el 22 de febrero, seguida de un lanzamiento público a través de una API el 17 de abril . Ayer se dio un nuevo paso en la difusión del modelo con la publicación de los archivos de puntos de control modelo Medium, pueden descargarse desde HuggingFace

Stable Diffusion 3 es el nuevo modelo de generación de imágenes de Stability AI, y estará disponible en una familia de modelos de distintos tamaños. El más grande, SD3 Large, tendrá 8.000 millones de parámetros, por ejemplo, mientras que el que se compartió ayer, SD3 Medium, sólo tiene 2.000 millones

Sin embargo, este pequeño tamaño puede ser una ventaja, ya que permite utilizar y ejecutar Stable Diffusion en ordenadores de consumo con menos potencia de cálculo.

Untitled

SD3 en una GPU de 5 GB

Mientras que muchos modelos de generación de imágenes requieren potentes tarjetas gráficas o GPU Nvidia de última generación, la versión Medium del nuevo modelo Stability AI cambia el paradigma y está diseñada para poder ejecutarse con configuraciones más ligeras.

Stable Diffusion Medium requiere un mínimo de 5 GB de VRAM, lo que significa que funcionará en una amplia variedad de PC de consumo y portátiles de gama alta.

Stability AI recomienda 16 GB de VRAM para un uso realmente cómodo y óptimo, lo que puede quedarse corto para la mayoría de portátiles, pero tampoco es descabellado.

Pequeño pero fuerte

A pesar de este tamaño reducido y del número relativamente pequeño de parámetros (2.000 millones, frente a los 6 de SDXL), SD3 Medium debería ofrecer un nivel de calidad excepcionalmente alto, comparable al de SD3 Large para toda una serie de funciones

Según Stability AI, SD3 Medium destaca por su fotorrealismo, su respeto de las indicaciones, su capacidad para generar texto y sus posibilidades de ajuste.

Los usuarios pueden esperar imágenes de alta calidad con la SD3 Medium gracias al VAE (Variational Autoencoder) de 16 canales, que permite a la SD3 ofrecer más detalles por megapíxel que cualquier modelo anterior.

SD3 también se ha hecho ya un nombre por su capacidad para respetar las indicaciones y sus detalles, que se deriva de una notable habilidad para comprender el lenguaje natural. SD3 es capaz, por ejemplo, de entender una descripción que contenga varios elementos de la imagen y su posición.

Compartir los archivos del modelo también allana el camino para perfeccionarlo y desarrollar modelos comunitarios basados en él, como ocurre con las versiones anteriores de Stable Diffusion.

Pero la característica más llamativa de SD3 Medium es su ligereza en términos de requisitos de recursos, lo que la convierte en una opción ideal para entornos en los que la gestión de recursos y la eficiencia son esenciales.

Untitled

Gratis pero no necesariamente libre

Stable Diffusion 3 Medium se publica bajo unalicencia libre no comercial y la nueva Stability Non-Commercial Research Community