Alors que Google et son Nano Banana Pro monopolisaient l'attention depuis une semaine, Black Forest Labs arrive avec du lourd. FLUX.2 ne se contente pas de s'aligner : il propose une alternative crédible, ouverte et professionnelle à l'hégémonie du géant de Mountain View.

flux-2.mp4

On les sentait venir depuis quelques semaines, entre rumeurs sur X et bruits de couloir sur Reddit. Cette fois, le doute n'est plus permis : FLUX.2 est disponible et il ne s'agit pas d'une simple mise à jour de courtoisie. Black Forest Labs (BFL) semble bien décidé à prouver que le modèle "Open Core" proposant à la fois des outils propriétaires de pointe et des versions accessibles aux chercheurs est tout aussi viable pour l'avenir de la création visuelle.

Un véritable outil de production

Si FLUX.1 avait marqué les esprits par son réalisme, FLUX.2 change de paradigme. L'ambition affichée est claire : passer du "jouet technologique" à l'outil "Production-Ready".

La fonctionnalité qui risque de faire le plus de bruit est sans doute le support natif multi-référence qui met le modèle de Black Forest Labs a niveau avec celui de Google. Concrètement, vous ne dépendez plus uniquement de votre capacité à rédiger un prompt parfait. Le modèle peut désormais ingérer jusqu'à 10 images de référence simultanément. Pour un créatif, c'est une petite révolution : cela permet de conserver la cohérence d'un personnage, d'un produit ou d'un style graphique spécifique à travers toute une série d'images.

image.png

Sous le capot : un monstre

Techniquement, BFL n'a pas fait les choses à moitié. Le modèle repose sur une architecture de 32 milliards de paramètres (pour la version [dev]). Pour donner un ordre d'idée, c'est massif.

Le moteur intègre un encodeur de texte basé sur Mistral-3, ce qui explique les progrès fulgurants annoncés en compréhension du langage naturel. Fini les mots-clés cryptiques ; le modèle comprend les instructions complexes, les relations spatiales et, cerise sur le gâteau, gère la typographie avec une fiabilité déconcertante. Les designers apprécieront également la prise en charge des codes couleurs HEX pour un respect strict des chartes graphiques.

Bien sûr, une telle puissance a un coût. Nativement, la bête demande près de 110 Go de VRAM. Heureusement, BFL a collaboré étroitement avec VIDIA pour proposer dès le lancement une optimisation en FP8. Résultat : une réduction de 40% des besoins en mémoire, rendant l'exécution du modèle [dev] possible sur une "simple" RTX 4090. Pour ceux qui n'ont pas une telle carte graphique sous la main, pas de panique, le cloud est là pour ça.

image.png

G6nbQl9XwAAwxCW.jpeg

À chacun son Flux.2

Comme pour la version précédente, la gamme est segmentée pour répondre à tous les besoins :

Une version [klein], plus légère et totalement open-source (Apache 2.0), est également dans les tuyaux pour une sortie prochaine.

teaser_generation.png

Comment tester dès maintenant ?