En un momento en que la inteligencia artificial generativa crece exponencialmente, el campo de la conversión de texto en imagen no deja de sorprender. Tras la entusiasta acogida de AuraFlow, ahora es el turno de Flux de irrumpir en el panorama de las alternativas a Stable Diffusion, de Stability AI.
Black Forest Labs, una nueva empresa especializada en IA generativa para los medios de comunicación, acaba de lanzar Flux, su conjunto de modelos de conversión de texto en imagen, con un enfoque de código abierto y un rendimiento impresionante, que lo convierten en un serio competidor no sólo de Stable Diffusion 3, sino también de otros líderes del sector como DALL-E y Midjourney.
El modelo texto-imagen de Flux, entrenado con un amplio conjunto de datos de imágenes y pies de foto, tiene una capacidad impresionante para generar imágenes fotorrealistas a partir de descripciones en lenguaje natural. El profundo conocimiento del lenguaje que posee el modelo le permite interpretar mensajes complejos y producir imágenes muy detalladas y coherentes.
Si quieres probar algunas generaciones con FLUX.1, puedes probar las distintas versiones en la plataforma Fal.AI y Replicate :
Replicate
Los dos ultimos modelos también se comparten en HuggingFace, donde pueden descargarse.
El equipo de Black Forest Labs ha compartido un código de muestra en Github que ya permite a desarrolladores y usuarios avanzados ejecutar los modelos en sus propias máquinas.