Les LoRAs offrent une approche astucieuse et efficace pour personnaliser le modèle Flux[dev] sans avoir à le ré-entraîner entièrement.
Cette technique permet en effet d'adapter le modèle à des concepts, des personnes ou des styles spécifiques, tout en gardant une empreinte légère en termes de calcul et de stockage.
L’entrainement d’un LoRA est en outre relativement facile et peut même se faire en ligne comme expliqué dans notre **Tutoriel sur l’entrainement d’un LoRA Flux.**
Mais la clé d'un LoRA efficace réside dans la qualité de son dataset d'entraînement. En effet, Les images que vous choisissez et préparez vont directement influencer les performances et la polyvalence de votre LoRA.
Dans cet article, nous allons voir ensemble comment constituer un dataset optimal. Nous aborderons des aspects essentiels tels que la quantité d'images nécessaire, l'importance de la diversité et de la qualité ainsi que la création de captions, ces descriptions d’image qui permettent à l’IA de mieux comprendre ce que vous souhaitez lui apprendre.
La première étape pour créer votre dataset est de sélectionner les images qui vont servir de données d’entrainement.
La première règle à respecter pour sélectionner vos images d’entrainement est d’en avoir la quantité idéale (suffisamment mais pas trop).
Il faut en effet avoir assez d’image pour que le modèle puisse apprendre votre concept dans sa globalité et sa diversité. Un grand nombre d’images permettra ainsi au modèle d’avoir une meilleure précision.
Mais en avoir de trop risque de surcharger le LoRA d’information (et d’augmenter le temps d’entrainement) - Et si elles ne sont pas toutes de bonnes qualité, le résultat sera encore moins bon.
Visez entre 10 et 20 images pour un LoRA de personnes ou de personnages - et éventuellement un peu plus pour des poses ou des styles. Certains utilisateurs ont pu créer un LoRA de personne avec seulement 5 images mais je pense qu’il vaut mieux en utiliser plus.
La seconde règle qui vient compléter la première, c’est de miser sur la diversité des contextes.
La variété est en effet la clé pour un modèle polyvalent.
Voici trois conseils pour diversifier votre set d'images :