<div style="text-align: right; font-size: 75%; margin-top: -40px; margin-right: 1ex" class="text-secondary-600 text-right small"><em>
Dernière mise à jour : 23/01/2026
</em></div>
Les LoRAs offrent une approche astucieuse et efficace pour personnaliser les modèles de génération d'images sans avoir à les ré-entraîner entièrement.
Cette technique permet en effet d'adapter un modèle de base à des concepts, des personnes ou des styles spécifiques, tout en gardant une empreinte légère en termes de calcul et de stockage.
L'entraînement d'un LoRA est en outre relativement facile et peut même se faire en ligne pour différents modèles comme Flux.1[dev], Flux.2 [klein], Qwen-Image, ou Z-Image-Turbo.
Mais la clé d'un LoRA efficace réside dans la qualité de son dataset d'entraînement. En effet, les images que vous choisissez et préparez vont directement influencer les performances et la polyvalence de votre LoRA.
Dans cet article, nous allons voir ensemble comment constituer un dataset optimal. Nous aborderons des aspects essentiels tels que la quantité d'images nécessaire, l'importance de la diversité et de la qualité ainsi que la création de captions, ces descriptions d'image qui permettent à l'IA de mieux comprendre ce que vous souhaitez lui apprendre.
<aside> 💡
A propos des modèles
Les principes fondamentaux présentés ici s'appliquent à tous les modèles de diffusion modernes.
Cependant, chaque modèle a ses spécificités. Nous essauerons donc de fournir également des recommandations adaptées pour Flux.1[dev], Flux.2 [klein], Qwen-Image et Z-Image-Turbo tout au long de l'article.
</aside>
La première étape pour créer votre dataset est de sélectionner les images qui vont servir de données d'entraînement. Voici les quatre règles d'or qui s'appliquent à tous les modèles.
La première règle à respecter pour sélectionner vos images d’entrainement est d’en avoir la quantité idéale (suffisamment mais pas trop).
Il faut en effet avoir assez d’image pour que le modèle puisse apprendre votre concept dans sa globalité et sa diversité. Un grand nombre d’images permettra ainsi au modèle d’avoir une meilleure précision.
Mais en avoir de trop risque de surcharger le LoRA d’information (et d’augmenter le temps d’entrainement) - Et si elles ne sont pas toutes de bonnes qualité, le résultat sera encore moins bon.
Il faut en général compter entre 10 et 20 images pour un LoRA de personnes ou de personnages - et éventuellement un peu plus pour des poses ou des styles.
| Modèle | Quantité recommandée | Notes spécifiques |
|---|---|---|
| Flux.1[dev] | 10-20 images | Idéal pour personnages et personnes |
| Flux.2 [klein] | 15-20 images | Peut nécessiter plus d'images pour édition multi-références |
| Qwen-Image | 10-20 images (base) | |
| 20-40 images (Edit) | Commencer petit pour la version Edit, augmenter si nécessaire | |
| Z-Image-Turbo | 20-30 images (caractères)70-80 images (photoréalisme extrême) | Plus d'images pour textures de peau réalistes |
Certains utilisateurs ont pu créer un LoRA de personne avec seulement 5-9 images mais je pense qu’il vaut généralement mieux en utiliser plus pour obtenir un résultat polyvalent.
La seconde règle qui vient compléter la première, c’est de miser sur la diversité des contextes.