Si alguna vez ha creado imágenes con Flux u otras IA como Stable Diffusion, probablemente se habrá dado cuenta de que las dimensiones y la resolución de la imagen pueden influir mucho en el resultado de sus generaciones.

En este artículo, exploraremos las resoluciones recomendadas para utilizar Flux de forma óptima, basándonos en pruebas personales, experiencias compartidas por la comunidad y las características técnicas del modelo.

Flux y sus resoluciones de imagen

Del píxel al lienzo digital

Según su creador, Flux admite y ha sido optimizado para una amplia gama de resoluciones, de 0,1 a 2,0 megapíxeles (MP). Esta flexibilidad permite adaptarlo a una gran variedad de necesidades, desde la creación rápida de prototipos a resoluciones muy bajas hasta la generación de imágenes de alta calidad.

Sin embargo, los usuarios más aventureros han comprobado que Flux sigue desenvolviéndose muy bien, incluso cuando se utilizan resoluciones más altas, de hasta 4 MP.

Proporciones ganadoras

Además del número total de píxeles, las proporciones o aspect ratio de la imagen pueden influir en los resultados de su generación. Es mejor utilizar proporciones estándar y evitar formatos exóticos en los que Flux tenderá a encuadrar peor los sujetos o a producir composiciones desequilibradas.

Resoluciones perfectas

Teniendo en cuenta todos estos factores, aquí tiene una tabla que resume las dimensiones en píxeles recomendadas para generar sus imágenes con Flux. Se han calculado para que se aproximen lo más posible a los valores objetivo en megapíxeles y, al mismo tiempo, sean divisibles por 64, lo que a menudo es necesario para evitar errores en algunas herramientas

Ratio Format S (0.1 MP) L (1.0 MP) XL (2.0 MP)
1:1 carré 320 x 320 1024 x 1024 1408 x 1408
3:2 paysage 384 x 256 1216 x 832 1728 x 1152
4:3 paysage 448 x 320 1152 x 896 1664 x 1216
16:9 paysage 448 x 256 1344 x 768 1920 x 1088
21:9 paysage 576 x 256 1536 x 640 2176 x 960
2:3 portrait 256 x 384 832 x 1216 1152 x 1728
3:4 portrait 320 x 448 896 x 1152 1216 x 1664
9:16 portrait 256 x 448 768 x 1344 1088 x 1920
9:21 portrait 256 x 576 640 x 1536 960 x 2176

Más allá de 2,0 MP

Muchos usuarios han probado resoluciones superiores con cierto éxito.

Resoluciones como 2560 x 1440 píxeles (cerca de 4,0 MP) funcionan y suelen dar texturas más detalladas. Pero esto no siempre se traduce en una mejor calidad general de la imagen. La generación lleva inevitablemente más tiempo, mientras que los resultados y las ganancias de calidad pueden ser variables.

Yendo un paso más allá, resoluciones de 4,0 MP como 3840 x 2160 píxeles aumentarán el tiempo (varios minutos para generar) y a menudo producirán resultados borrosos o imágenes de baja calidad. Evidentemente, Flux no está hecho para estas dimensiones.

El equilibrio entre tamaño y tiempo

Además de las capacidades del propio modelo, también debe tener en cuenta el rendimiento y las limitaciones de su hardware. Generar una imagen de 1920 x 1088, es decir, de 2 megapíxeles, llevará bastante más tiempo. En una tarjeta gráfica RTX 4090 que utilice la versión FP8 de Flux, una imagen de este tipo tardará unos 30 segundos, frente a los tres segundos o menos de una imagen de 448 x 256 (0,1 MP).

Si desea generar imágenes rápidamente para crear prototipos, las resoluciones más bajas, como 0,1 MP, pueden ser muy útiles. Para imágenes de calidad, las resoluciones de 1,0 MP suelen ser suficientes, pero es posible que desee pasar a 2,0 MP o más en función de sus necesidades (pantalla grande, impresión de alta definición, etc.).

Ejemplos de imágenes en distintos formatos

Aquí tiene una serie de imágenes generadas con Flux a 1,0 MP para ayudarle a visualizar las diferentes proporciones de imagen.