Qwen-Image : Conçu pour la beauté, construit pour le contrôle

Qwen-Image est un modèle de fondation de 20 milliards de paramètres construit sur l'architecture MMDiT, conçu pour la génération d'images haute fidélité et l'édition visuelle fine. Il se distingue par sa capacité à restituer des textes complexes directement dans les images, à effectuer une édition précise des images et à maintenir une cohérence remarquable entre les sujets, les mises en page et les styles.
Contrairement à la plupart des modèles de génération d'images, Qwen-Image peut intégrer de manière transparente la conception visuelle et la typographie, créant ainsi un nouveau paradigme pour les créateurs de contenu, les concepteurs et les artistes qui accordent de l'importance à la liberté de création et à la précision au pixel près.
Chez PicLumen, nous proposons deux modèles : Qwen-Image pour la génération de haute qualité (sans édition) et Qwen-Image-Edit pour la génération et l'édition. Choisissez le modèle qui correspond le mieux à vos besoins.
Faits marquants
- Maîtrise du rendu de texte - Générer des images comprenant du texte réaliste et de forme correcte dans plusieurs langues et styles, en conservant l'alignement, la perspective et la cohérence des matériaux.
- Pipeline d'édition puissant - Modifiez les images existantes à l'aide d'instructions textuelles ou de références visuelles, tout en préservant la structure, l'éclairage et l'identité.
- Sensibilisation à la mise en page et à la composition - Comprend la composition de la conception, ce qui permet de placer naturellement des éléments tels que des titres, des sous-titres et des objets.
- Identité et cohérence - Maintient la cohérence des sujets, des visages, des logos de marque et d'autres caractéristiques distinctives à travers plusieurs générations.
- Flexibilité esthétique - Capable de produire des images dans les styles de la photographie, de l'illustration, du cinéma et de la conception graphique avec un éclairage riche et des textures détaillées.
1. Génération de texte à partir d'images (Qwen-Image)
Présentation
Qwen-Image accepte les descriptions purement textuelles et crée des compositions visuelles qui intègrent la typographie, la mise en page et le style en tant que partie intégrante de l'image elle-même.
Conseils pour l'incitation
- Préciser l'emplacement du texte et décrire ses qualités visuelles.
- Combiner les détails du texte avec le contexte environnemental.
- Inclure des conseils sur le matériel et le ton.
- Mentionnez des concepts de design tels que le style éditorial ou l'esthétique art-déco.
Exemple

Proposition : Une publicité pour un parfum haut de gamme présentant un flacon en verre avec un bouchon doré sur un piédestal en marbre, entouré d'une douce brume. Un grand texte élégant avec empattement sur la moitié supérieure indique "Eau d'Élégance" en or métallique ; un slogan subtil en dessous : "Essence of Timeless Beauty" (Essence de la beauté intemporelle) en fines lettres blanches.
2. Édition d'images (Qwen-Image-Edit)
Présentation
Le mode édition de Qwen-Image permet aux utilisateurs de modifier une image existante à l'aide d'instructions descriptives - telles que la modification de l'arrière-plan, des matériaux, de l'éclairage ou l'ajout de texte - tout en préservant l'intégrité du sujet d'origine.
Conseils pour l'incitation
- Décrire explicitement ce qui doit rester inchangé.
- Décrivez précisément la modification.
- Clarifier l'humeur et le ton.
- Inclure des indications de position comme le coin supérieur droit ou le titre centré.
Exemples


Invitation : "Gardez le produit identique, remplacez l'arrière-plan par un mur de béton texturé éclairé par une lumière latérale douce, et superposez la phrase "Pure Sound" dans une police blanche à empattement fin près du bas".


Invitation : Modifiez la tasse à café posée sur une table en bois, en conservant sa forme et son logo. Remplacez l'arrière-plan par un décor de cuisine lumineux et ajoutez un texte subtil en relief doré "Morning Ritual" sur la tasse.


Invitation : Remplacez le garçon de l'image par une fille d'anime aux longs cheveux noirs, en gardant les vêtements et les autres parties inchangés.

Invitation 1 : Tenez-vous debout, une main sur la hanche et l'autre formant un V.
Invitation 2 : Formez un cœur avec vos deux mains.
Invitation 3 : Tenir à deux mains un petit tableau noir sur lequel est écrit "Welcome to PicLumen".
Invitation 4 : Rapprochez l'appareil photo.
3. Édition d'images multiples
Vue d'ensemble
Qwen-Image-Edit permet de combiner plusieurs entrées d'images - en fusionnant les sujets et les environnements en scènes cohérentes.
Conseils pour l'incitation
- Décrivez le rôle de chaque image.
- Définir les modalités de leur fusion.
- Maintenir le réalisme.
- Ajoutez une direction stylistique comme la lumière cinématographique ou la composition éditoriale.
Exemple

Invitation : "La femme de la figure 2 prend un bain de soleil sur la chaise longue de la figure 1 et porte des lunettes de soleil.
4. Transfert de style et transformation de la vue
Présentation
Qwen-Image prend en charge la réinterprétation stylistique et la transformation du point de vue - en transformant des images existantes en de nouvelles compositions artistiques ou cinématographiques tout en préservant l'intégrité de la structure.
Conseils pour l'incitation
- Mentionnez les styles source et cible.
- Définir le nouvel angle ou point de vue de la caméra.
- Inclure des indices d'éclairage et de tonalité.
- Utilisez des références artistiques telles que des affiches pop-art ou des bandes dessinées.
Exemple


Invitation : "Transformez l'image en une affiche 2D de style anime avec des contours épais et des blocs de couleurs vives ; conservez les détails de la pose et de la tenue.


Invitation : Transformez l'image en une esquisse au crayon monochrome noir/blanc.
5. Édition de texte dans l'image
Présentation
Qwen-Image-Edit permet de modifier et de remplacer du texte directement à l'intérieur des images, en préservant la police originale, l'emplacement et les effets tels que les ombres et les reflets métalliques. Son avantage par rapport à d'autres modèles réside dans sa capacité à gérer des textes plus complexes, tels que le chinois, le japonais et le coréen.
Conseils pour l'incitation
- Décrivez le style de texte existant.
- Préciser ce qui doit être modifié.
- Mentionnez les raffinements tels que l'éclat ou le ton de la couleur.
- Veillez à ce que les indications de mise en page soient précises.
Exemple


Invitation : "Changez le texte "SOLDES D'ÉTÉ" en "LANCEMENT DES FÊTES" en gardant la police, la taille et l'ombre identiques.
Qwen-Image-Edit peut également prendre en charge le remplacement de texte complexe.


Invitation : Remplacez le texte "Accessoires de la vie estivale" par "夏日生活搭子"

Prompt : Trois filles animées tenant trois pancartes "欢迎光临", "ようこそ", et "환영합니다", chacune avec des expressions faciales différentes, se tenant devant un fond de café.
6. Contrôle avancé
Vue d'ensemble
Nous arrivons maintenant à ma partie préférée : Qwen-Image-Edit prend en charge le conditionnement de type ControlNet similaire à celui que nous avions à l'époque du SDXL. Mieux encore, il supporte nativement trois modes puissants à la fois : OpenPose, Depth et Canny.
Conseils pour l'incitation
- Préparez l'image que vous souhaitez utiliser pour le contrôle. (Dans PicLumen, utilisez Référence de l'image au lieu de Contrôle d'imagecar Qwen est guidé directement par l'image elle-même plutôt que par un pipeline ControlNet traditionnel).
- Décrivez clairement le résultat visuel ou l'effet que vous souhaitez obtenir.
Exemple



Invitation : "La fille de la figure 2 prend la pose de la figure 1.
Rédiger des messages d'encouragement efficaces
- Soyez descriptif, pas abstrait. Utilisez des détails vivants.
- Spécifiez les matériaux et l'éclairage. Des termes tels que " mat", " velours", " néon" favorisent le réalisme.
- Utilisez des signaux de position clairs.
- Mettez l'accent sur le ton émotionnel.
- Combiner le sujet et le style.
- Répéter et affiner.
- Équilibrer les images et le texte.
- Utiliser une terminologie artistique familière.
Cas d'utilisation pratiques
Visuels de marque ou de campagne

Invitation : "Un flacon de produit de soin élégant devant de doux nuages, le titre 'Glow Within' en fines lettres argentées, des tons pastel calmes."
Présentation des produits et merchandising visuel

Invitation : "Des baskets blanches placées sur un sol noir réfléchissant avec un léger éclairage, texte superposé 'Step Ahead' en sans-serif mince".
Illustrations ou affiches

Prompt : "Personnage illustré se tenant sur un toit futuriste, titre en néon 'NEXT ERA' s'illuminant derrière, éclairage comique".
Qwen-Image Prompt Library
1. Affiche éditoriale moderne

"Femme en trench beige près d'une fenêtre, titre 'THE STYLE ISSUE', sous-titre 'Timeless Design'. Variante : Homme en costume, tonalité noir et blanc, titre 'L'ÉDITION DE LA CLASSE'".
2. Illustration artistique du concept

"Fille sous un réverbère par une nuit pluvieuse, atmosphère cinématographique. Variante : Garçon à côté d'une voiture de collection sous les néons".
3. Vitrine des produits

"Ecouteurs sans fil sur une surface noire mate, lumière périphérique douce, titre 'Sonic Clarity'".
4. Scène cinématographique

"Homme marchant dans une rue brumeuse la nuit, reflet sur la route mouillée, titre 'MIDNIGHT ECHO'. Variante : Femme près d'une voiture sous un néon rouge, titre 'AFTERGLOW'.
5. Mode de vie et décoration intérieure

"Salon minimal avec lumière du soleil, canapé blanc et meubles en bois, texte 'Calm Spaces'".
6. Portrait artistique

"Portrait en gros plan avec une douce lumière dorée. Les cheveux blonds flottent devant le visage, tonalité picturale.
7. Affiche graphique vintage

"Affiche de moto illustrée, formes géométriques rouges et beiges, titre 'SPEED & GRACE'.
Conseils pour l'utilisation des messages-guides
- Privilégiez les matériaux, l'éclairage et le ton plutôt que la résolution.
- Combiner des éléments visuels et textuels.
- Utilisez des détails spécifiques et concrets.
- Affiner les résultats en utilisant le mode édition.
- Veiller à ce que le style soit cohérent d'une série à l'autre.
Conclusion
Qwen-Image fusionne la compréhension du texte, la génération visuelle et l'édition précise en un seul système, ce qui permet des flux de travail créatifs et de conception de qualité professionnelle sans post-édition ni outils externes.
Le modèle a un potentiel extrêmement élevé, mais il nécessite des compétences avancées en matière de création de messages pour en tirer toute la puissance. Une autre caractéristique notable de Qwen-Image est qu'il produit des résultats relativement cohérents sur plusieurs générations utilisant la même invite. Par conséquent, nous vous recommandons de ne générer qu'une seule image par invite, ce quivous permet d'économiser des lumens et du temps de génération.
Lorsque l'image générée contient des problèmes logiques mineurs ou des détails qui doivent être affinés, vous pouvez effectuer plusieurs générations de sélection pour affiner le résultat.
Avec son nombre de paramètres de modèle de 20B, Qwen offre de vastes possibilités créatives - c'est maintenant à votre tour de libérer votre imagination. Bonne inspiration !