Flux Nunchaku est un moteur d'inférence révolutionnaire développé par le MIT HAN Lab, spécialement conçu pour accélérer drastiquement la génération d'images avec les modèles Flux.

Cette solution d'optimisation utilise la quantification SVDQuant 4-bit pour transformer complètement l'expérience utilisateur, rendant la génération d'images haute qualité accessible même sur du matériel grand public.

Pourquoi Nunchaku ?

Le nom Nunchaku évoque la rapidité et l'efficacité de cette technologie d'accélération. Tout comme l'arme traditionnelle permet des mouvements fluides et rapides, Flux Nunchaku rend la génération d'images jusqu'à 10 fois plus rapide tout en réduisant drastiquement l'utilisation de la mémoire GPU.

Face aux limitations des modèles de diffusion traditionnels Nunchaku apporte une solution élégante qui démocratise l'accès à la génération d'images haute qualité.

Qu'est-ce que la méthode SVDQuant 4-bit ?

La technologie SVDQuant (Singular Value Decomposition Quantization) est au cœur de l'optimisation Nunchaku. Cette méthode avancée de quantification permet de réduire la précision des poids du modèle de 16 bits à 4 bits sans compromettre significativement la qualité des résultats.

Caractéristiques de SVDQuant

Les avantages de Nunchaku

flux-nunchaku-2.png

Performances comparatives

Voici un aperçu des gains de performance typiques avec Nunchaku :

Configuration Temps (FP16) Temps (Nunchaku) Gain
RTX 4090 45s 5s
RTX 3090 60s 6s 10×
RTX 4070 90s 12s 7.5×

Flux + Nunchaku = 💥

La communauté Flux a rapidement adopté Nunchaku pour tous les modèles de la gamme FLUX.1, offrant des performances extraordinaires même sur des systèmes aux ressources limitées.