L'équipe Qwen d'Alibaba Cloud vient de sortir un modèle d'IA qui change la donne dans l'édition d'images : Qwen-Image-Layered. En effet, ce nouveau modèle open source ne se contente pas de générer ou modifier des images plates, mais les décompose automatiquement en plusieurs calques indépendants. Une approche qui rapproche encore un peu plus les workflows de l'IA générative de ceux des designers professionnels.
Imaginez que vous preneiz une photo classique et que, d'un coup de baguette magique numérique, elle se transforme en un projet Photoshop structuré avec plusieurs calques séparés.
C'est exactement ce que fait Qwen-Image-Layered. Ce modèle analyse une image et la découpe automatiquement en plusieurs couches (avec même un canal alpha pour la transparence), chacune correspondant à un élément sémantique distinct : l'arrière-plan, le sujet principal, les objets secondaires, etc.

Jusqu’ici, la plupart des modèles d'édition d'images travaillaient sur des images plates. Même les outils de segmentation sophistiqués de type SAM (Segment Anything Model) se contentent d'identifier et d'isoler des objets. Qwen-Image-Layered va doncbeaucoup plus loin : il génère de véritables calques complets en reconstruisant intelligemment les parties cachées de l'image. Typiquement, si un personnage masque une partie du décor, le modèle imagine et génère ce qui devrait logiquement se trouver derrière.
Cette approche résout un problème fondamental de l'édition d'images assistée par IA : la cohérence. Quand tous les éléments sont fusionnés sur une seule toile, modifier un détail sans affecter le reste relève trop souvent du casse-tête. Avec des calques physiquement séparés, chaque modification reste isolée sur sa couche, éliminant les problèmes de dérive sémantique ou les problème d’alignements géométriques.

L'un des points forts du modèle, c'est sa capacité à s'adapter à la complexité de l'image. Qwen-Image-Layered ajuste automatiquement sa décomposition. Une scène simple donnera 3 ou 4 calques (arrière-plan, sujet, premier plan), tandis qu'une composition complexe pourra être divisée en 6, 8 couches ou plus selon les besoins.

Encore mieux : le système supporte la décomposition récursive. Si un calque généré contient lui-même plusieurs éléments distincts, vous pouvez demander au modèle de le subdiviser à nouveau. Cette approche permet théoriquement une décomposition à l'infini, ajustée au niveau de granularité souhaité.
Pour les professionnels de l'image, les applications pratiques sont nombreuses. Prenons l'exemple d'un photographe de produits : au lieu de refaire 10 shooting différents pour tester plusieurs décors, il peut décomposer une seule photo en calques pour remplacer uniquement l'arrière-plan tout en gardant le produit et les accessoires intacts. Plusieurs variantes sont donc créées en quelques minutes au lieu de plusieurs heures de production.
Les créateurs de contenu pour les réseaux sociaux peuvent rapidement générer des variations pour l'A/B testing : recolorer un élément sur un calque, déplacer un objet, ou tester différentes compositions sans repartir de zéro à chaque fois. Et pour les graphistes et designers web, c'est la possibilité d'itérer rapidement sur des concepts visuels en manipulant indépendamment chaque élément de la composition.
Le modèle trouvera aussi certainement une utilité dans l'industrie du manga et de l'animation. Des membres de la communauté ont déjà signalé son usage pour retirer proprement des bulles de dialogue ou séparer des éléments en vue d'une animation. La décomposition en calques facilite grandement les workflows d'animation 2D en transformant une illustration plate en composition multi-couches exploitable.
Le modèle est publié sous licence Apache 2.0, ce qui permet une utilisation libre, y compris dans des contextes commerciaux, sans restriction particulière. Les poids du modèle sont disponibles sur Hugging Face et ModelScope, accompagnés d'une documentation complète et d'exemples de code Python pour démarrer rapidement.

Qwen-Image-Layered peut également être testé sur l’une des pages officielles de demo (HuggingFace ou Modelscope) ainsi que sur Qwen Chat.