Flux NF4, plus précisément le modèle flux1-dev-bnb-nf4-v2
, est une variante du modèle de génération d'images Flux.1 [dev].
Développé par le créateur connu sous le nom de lllyasviel (également créateur de Forge et développeur de ControlNet), il a été conçu pour optimiser les performances de génération d'images, en offrant des améliorations significatives en termes de vitesse et d'efficacité par rapport aux modèles précédents, notamment le modèle d'origine.
Le sigle NF4 désigne une méthode de quantification appelée Normal Float 4-bit qui est utilisée principalement pour optimiser les modèles d'apprentissage automatique, notamment dans le cadre de la fine-tuning des modèles de langage. Ce format de quantification est particulièrement efficace pour réduire l'utilisation de la mémoire tout en maintenant une performance acceptable.
En travaillant sur l’intégration de Flux dans l’interface Forge UI, lllyasviel a cherché à optimiser la vitesse de Flux et a mis au point cette version NF4. Le résultat s’est révélé à la hauteur de ses espérances, particulièrement pour les GPU avec 12Gb ou moins.
Bien que le modèle NF4 soit optimisé pour la vitesse et l'efficacité, des tests ont montré qu'il peut souffrir d'une perte de qualité par rapport à des modèles comme GGUF-Q8 et FP16. En effet, certaines comparaisons indiquent que le modèle GGUF-Q8 offre une qualité d'image presque identique au modèle FP16 tout en nécessitant moins de mémoire vidéo (VRAM)
NF4 requiert une version de CUDA supérieure ou égale à la 11.7. Cette version est disponible les sur des cartes graphiques modernes comme les séries NVIDIA RTX 3XXX/4XXX.
Les utilisateurs avec des GPU plus anciens ne pourront cependant pas utiliser Flux NF4 et doivent donc opter pour d’autres formats comme Flux GGUF.
Flux NF4 et GGUF-Q8 présentent des différences notables :