Flux Nunchaku est un moteur d'inférence révolutionnaire développé par le MIT HAN Lab, spécialement conçu pour accélérer drastiquement la génération d'images avec les modèles Flux.
Cette solution d'optimisation utilise la quantification SVDQuant 4-bit pour transformer complètement l'expérience utilisateur, rendant la génération d'images haute qualité accessible même sur du matériel grand public.
Le nom Nunchaku évoque la rapidité et l'efficacité de cette technologie d'accélération. Tout comme l'arme traditionnelle permet des mouvements fluides et rapides, Flux Nunchaku rend la génération d'images jusqu'à 10 fois plus rapide tout en réduisant drastiquement l'utilisation de la mémoire GPU.
Face aux limitations des modèles de diffusion traditionnels Nunchaku apporte une solution élégante qui démocratise l'accès à la génération d'images haute qualité.
La technologie SVDQuant (Singular Value Decomposition Quantization) est au cœur de l'optimisation Nunchaku. Cette méthode avancée de quantification permet de réduire la précision des poids du modèle de 16 bits à 4 bits sans compromettre significativement la qualité des résultats.
Voici un aperçu des gains de performance typiques avec Nunchaku :
Configuration | Temps (FP16) | Temps (Nunchaku) | Gain |
---|---|---|---|
RTX 4090 | 45s | 5s | 9× |
RTX 3090 | 60s | 6s | 10× |
RTX 4070 | 90s | 12s | 7.5× |
La communauté Flux a rapidement adopté Nunchaku pour tous les modèles de la gamme FLUX.1, offrant des performances extraordinaires même sur des systèmes aux ressources limitées.