Qwen-Image est un modèle de génération d'images par intelligence artificielle développé par l'équipe Qwen d'Alibaba.
Conçu pour transformer des descriptions textuelles en visuels, il a été lancé en août 2025 et se distingue par sa maîtrise inégalée du rendu de texte complexe. ainsi que par ses capacités avancées d'édition d'images.
Premier modèle « fondation » de la série Qwen dédié à l'image, Qwen-Image rivalise directement avec les leaders du marché tout en restant entièrement open-source.
<a
href="<https://getimg.ai/image-generator?via=stabletom&model=model-qwen/qwen-image>"
class="w-full link !text-primary-500 !opacity-100 !border-primary-500 hover:!opacity-80 feather-button-link inline-flex items-center justify-center bg-primary-500 text-base font-semibold !text-primary-50 rounded-cta-button-radius px-2 py-4 hover:bg-primary-600 hover:text-secondary-100 focus:outline-none focus:outline-2 focus:outline-offset-2 focus:outline-primary-500 active:bg-primary-800 active:text-blue-100"
data-umami-event="Clicked Link: getimg.ai qwen-image"
data-umami-href="getimg.ai/image-generator?via=stabletom&model=model-qwen/qwen-image"
style="font-size: 120%"
target="_blank"
>
→ Essayer Qwen Image
</a>

<aside> ⭐
</aside>
<aside> 🗞️

20/08/25 - Les modèles Qwen Image et Qwen Image Edit sont disponibles nativement dans ComfyUI.

20/08/25 - Alibaba enrichit sa suite Qwen avec un modèle d'édition d'images ultra-précis et gratuit.
</aside>
Qwen-Image est un modèle de diffusion avancé de 20 milliards de paramètres basé sur une architecture MMDiT (Multimodal Diffusion Transformer). Ce qui le rend unique, c'est sa capacité remarquable à intégrer du texte complexe directement dans les images générées, une compétence où la plupart des modèles échouent encore aujourd'hui.

Le modèle excelle dans quatre domaines principaux :
Rendu de texte avancé – Qwen-Image peut incorporer des paragraphes entiers, des formules mathématiques et des détails typographiques complexes avec une fidélité impressionnante, supportant aussi bien les alphabets occidentaux que les caractères logographiques (chinois, japonais, coréen).
Édition d'images intelligente – Au-delà de la génération pure, le modèle offre des fonctionnalités d'édition sophistiquées : modification de texte existant, transfert de style, insertion/suppression d'objets, et manipulation contrôlée des poses humaines.
Polyvalence stylistique – De la photographie réaliste aux peintures impressionnistes, en passant par les styles manga ou les designs minimalistes, Qwen-Image s'adapte à une vaste gamme d'esthétiques créatives.
Compréhension multilingue – Entraîné pour gérer parfaitement le chinois et l'anglais, il préserve avec précision la typographie et la mise en page quelle que soit la langue utilisée.
Développé selon une approche d'apprentissage progressif ("curriculum learning"), le modèle a été formé en passant de tâches simples (images sans texte) vers des scénarios complexes (prompts de plusieurs paragraphes), renforçant ainsi sa capacité à traiter des instructions textuelles sophistiquées.
Lancé le 18 août 2025, Qwen Image Edit étend les capacités de Qwen-Image vers l'édition d'images spécialisée. Construit sur la base solide du modèle de 20 milliards de paramètres, il introduit une architecture de double encodage révolutionnaire.
La vraie innovation de Qwen Image Edit réside dans son système de traitement dual qui analyse les images à travers deux flux parallèles :
Premier flux sémantique : Un modèle vision-langage Qwen2.5-VL extrait les caractéristiques sémantiques de haut niveau, permettant au système de "comprendre" le sens de l'image et les relations entre objets.
Second flux reconstructif : Un Variational Autoencoder (VAE) spécialement affiné capture les détails de bas niveau, garantissant que les zones non modifiées restent parfaitement préservées.
Cette approche permet deux modes d'édition complémentaires :

Qwen-Image est développé par l'équipe Qwen d'Alibaba, une division de recherche spécialisée dans les modèles de fondation et l'intelligence artificielle multimodale. Cette équipe est déjà reconnue pour sa série de modèles Qwen, qui comprend des LLM performants comme Qwen2.5 et plus récemment Qwen3.
Alibaba Cloud, à travers sa plateforme technologique, s'impose comme un acteur majeur de l'IA générative en Asie. L'entreprise investit massivement dans la recherche en IA depuis plusieurs années, avec un focus particulier sur les modèles multilingues adaptés aux besoins des marchés asiatiques tout en restant compétitifs à l'international.
La stratégie open-source d'Alibaba avec Qwen-Image témoigne de sa volonté de se placer comme une référence en IA tout en démocratisant l'accès à des technologies d'IA avancées. Pour cela, ils ont publié non seulement les poids du modèle mais aussi l'intégralité du code source et de sa documentation technique.

Le moyen le plus simple d'accéder à Qwen-Image est via l'interface officielle sur chat.qwen.ai :
Accessible gratuitement et sans inscription, l'interface est particulièrement conviviale pour les non-spécialistes, permettant de formuler simplement des requêtes comme "Dessine une affiche avec du texte en français" pour obtenir des résultats professionnels.
De la même manière, vous pouvez tester Qwen Image Edit directement sur le chat en choisissant Edition d’image et en décrivant les modifications souhaitées.

