Manuel Qwen-Image

Qwen-Image : Conçu pour la beauté, construit pour le contrôle

carte modèle qwen

Qwen-Image est un modèle de fondation de 20 milliards de paramètres construit sur l'architecture MMDiT, conçu pour la génération d'images haute fidélité et l'édition visuelle fine. Il se distingue par sa capacité à restituer des textes complexes directement dans les images, à effectuer une édition précise des images et à maintenir une cohérence remarquable entre les sujets, les mises en page et les styles.

Contrairement à la plupart des modèles de génération d'images, Qwen-Image peut intégrer de manière transparente la conception visuelle et la typographie, créant ainsi un nouveau paradigme pour les créateurs de contenu, les concepteurs et les artistes qui accordent de l'importance à la liberté de création et à la précision au pixel près.

Chez PicLumen, nous proposons deux modèles : Qwen-Image pour la génération de haute qualité (sans édition) et Qwen-Image-Edit pour la génération et l'édition. Choisissez le modèle qui correspond le mieux à vos besoins.


Faits marquants

  • Maîtrise du rendu de texte - Générer des images comprenant du texte réaliste et de forme correcte dans plusieurs langues et styles, en conservant l'alignement, la perspective et la cohérence des matériaux.
  • Pipeline d'édition puissant - Modifiez les images existantes à l'aide d'instructions textuelles ou de références visuelles, tout en préservant la structure, l'éclairage et l'identité.
  • Sensibilisation à la mise en page et à la composition - Comprend la composition de la conception, ce qui permet de placer naturellement des éléments tels que des titres, des sous-titres et des objets.
  • Identité et cohérence - Maintient la cohérence des sujets, des visages, des logos de marque et d'autres caractéristiques distinctives à travers plusieurs générations.
  • Flexibilité esthétique - Capable de produire des images dans les styles de la photographie, de l'illustration, du cinéma et de la conception graphique avec un éclairage riche et des textures détaillées.


1. Génération de texte à partir d'images (Qwen-Image)

Présentation
Qwen-Image accepte les descriptions purement textuelles et crée des compositions visuelles qui intègrent la typographie, la mise en page et le style en tant que partie intégrante de l'image elle-même.

Conseils pour l'incitation

  • Préciser l'emplacement du texte et décrire ses qualités visuelles.
  • Combiner les détails du texte avec le contexte environnemental.
  • Inclure des conseils sur le matériel et le ton.
  • Mentionnez des concepts de design tels que le style éditorial ou l'esthétique art-déco.

Exemple

Publicité pour un parfum générée par l'IA avec un flacon en verre sur un socle en marbre, texte à empattement doré "Eau d'Élégance", créée par le modèle Qwen-Image.

Proposition : Une publicité pour un parfum haut de gamme présentant un flacon en verre avec un bouchon doré sur un piédestal en marbre, entouré d'une douce brume. Un grand texte élégant avec empattement sur la moitié supérieure indique "Eau d'Élégance" en or métallique ; un slogan subtil en dessous : "Essence of Timeless Beauty" (Essence de la beauté intemporelle) en fines lettres blanches.


2. Édition d'images (Qwen-Image-Edit)

Présentation
Le mode édition de Qwen-Image permet aux utilisateurs de modifier une image existante à l'aide d'instructions descriptives - telles que la modification de l'arrière-plan, des matériaux, de l'éclairage ou l'ajout de texte - tout en préservant l'intégrité du sujet d'origine.

Conseils pour l'incitation

  • Décrire explicitement ce qui doit rester inchangé.
  • Décrivez précisément la modification.
  • Clarifier l'humeur et le ton.
  • Inclure des indications de position comme le coin supérieur droit ou le titre centré.

Exemples

Casque d'écoute noir mat édité par l'IA sur fond de mur en béton avec texte blanc "Pure Sound", photo de produit améliorée par Qwen-Image - source
Casque d'écoute noir mat sur fond de mur en béton avec texte blanc "Pure Sound", photo de produit améliorée par Qwen-Image -edited.

Invitation : "Gardez le produit identique, remplacez l'arrière-plan par un mur de béton texturé éclairé par une lumière latérale douce, et superposez la phrase "Pure Sound" dans une police blanche à empattement fin près du bas".

Photo d'une tasse à café éditée avec AI pour ajouter un texte doré "Morning Ritual" et un arrière-plan de cuisine lumineux - source
Photo de tasse à café éditée avec AI pour ajouter le texte doré 'Morning Ritual' et un fond de cuisine lumineux - édité

Invitation : Modifiez la tasse à café posée sur une table en bois, en conservant sa forme et son logo. Remplacez l'arrière-plan par un décor de cuisine lumineux et ajoutez un texte subtil en relief doré "Morning Ritual" sur la tasse.

Image composite d'IA fusionnant un portrait de mode et un coucher de soleil sur la plage, avec des reflets chauds sur les lunettes de soleil, créée par Qwen-Image - source
Image composite AI fusionnant un portrait de mode et un coucher de soleil sur la plage, avec des reflets chauds sur les lunettes de soleil, créée par Qwen-Image - édité

Invitation : Remplacez le garçon de l'image par une fille d'anime aux longs cheveux noirs, en gardant les vêtements et les autres parties inchangés.

Multi steps edit by Qwen-Image

Invitation 1 : Tenez-vous debout, une main sur la hanche et l'autre formant un V.

Invitation 2 : Formez un cœur avec vos deux mains.

Invitation 3 : Tenir à deux mains un petit tableau noir sur lequel est écrit "Welcome to PicLumen".

Invitation 4 : Rapprochez l'appareil photo.


3. Édition d'images multiples

Vue d'ensemble
Qwen-Image-Edit permet de combiner plusieurs entrées d'images - en fusionnant les sujets et les environnements en scènes cohérentes.

Conseils pour l'incitation

  • Décrivez le rôle de chaque image.
  • Définir les modalités de leur fusion.
  • Maintenir le réalisme.
  • Ajoutez une direction stylistique comme la lumière cinématographique ou la composition éditoriale.

Exemple

Image composite d'IA fusionnant un portrait de mode et un coucher de soleil sur la plage, avec des reflets chauds sur les lunettes de soleil, créée par Qwen-Image.

Invitation : "La femme de la figure 2 prend un bain de soleil sur la chaise longue de la figure 1 et porte des lunettes de soleil.


4. Transfert de style et transformation de la vue

Présentation
Qwen-Image prend en charge la réinterprétation stylistique et la transformation du point de vue - en transformant des images existantes en de nouvelles compositions artistiques ou cinématographiques tout en préservant l'intégrité de la structure.

Conseils pour l'incitation

  • Mentionnez les styles source et cible.
  • Définir le nouvel angle ou point de vue de la caméra.
  • Inclure des indices d'éclairage et de tonalité.
  • Utilisez des références artistiques telles que des affiches pop-art ou des bandes dessinées.

Exemple
 

L'IA transforme un portrait de rue en affiche pop-art avec une texture en demi-teinte et des couleurs vives - source
Transformation par l'IA d'un portrait de rue en poster pop-art avec une texture en demi-teinte et des couleurs vives - édité

Invitation : "Transformez l'image en une affiche 2D de style anime avec des contours épais et des blocs de couleurs vives ; conservez les détails de la pose et de la tenue.

Invitation : Transformez l'image en une esquisse au crayon monochrome noir/blanc.


5. Édition de texte dans l'image

Présentation
Qwen-Image-Edit permet de modifier et de remplacer du texte directement à l'intérieur des images, en préservant la police originale, l'emplacement et les effets tels que les ombres et les reflets métalliques. Son avantage par rapport à d'autres modèles réside dans sa capacité à gérer des textes plus complexes, tels que le chinois, le japonais et le coréen.

Conseils pour l'incitation

  • Décrivez le style de texte existant.
  • Préciser ce qui doit être modifié.
  • Mentionnez les raffinements tels que l'éclat ou le ton de la couleur.
  • Veillez à ce que les indications de mise en page soient précises.

Exemple

Panneau d'affichage édité par l'IA remplaçant "SUMMER SALE" par "HOLIDAY LAUNCH" tout en conservant la police et les ombres - source
Panneau d'affichage édité par AI remplaçant "SUMMER SALE" par "HOLIDAY LAUNCH" tout en conservant la police et les ombres - édité

Invitation : "Changez le texte "SOLDES D'ÉTÉ" en "LANCEMENT DES FÊTES" en gardant la police, la taille et l'ombre identiques.

Qwen-Image-Edit peut également prendre en charge le remplacement de texte complexe.

exemple d'édition de texte par Qwen-Image - source
exemple d'édition de texte par Qwen-Image - édité

Invitation : Remplacez le texte "Accessoires de la vie estivale" par "夏日生活搭子"

rendu de texte complexe par Qwen-Image

Prompt : Trois filles animées tenant trois pancartes "欢迎光临", "ようこそ", et "환영합니다", chacune avec des expressions faciales différentes, se tenant devant un fond de café.


6. Contrôle avancé

Vue d'ensemble
Nous arrivons maintenant à ma partie préférée : Qwen-Image-Edit prend en charge le conditionnement de type ControlNet similaire à celui que nous avions à l'époque du SDXL. Mieux encore, il supporte nativement trois modes puissants à la fois : OpenPose, Depth et Canny.

Conseils pour l'incitation

  • Préparez l'image que vous souhaitez utiliser pour le contrôle. (Dans PicLumen, utilisez Référence de l'image au lieu de Contrôle d'imagecar Qwen est guidé directement par l'image elle-même plutôt que par un pipeline ControlNet traditionnel).
  • Décrivez clairement le résultat visuel ou l'effet que vous souhaitez obtenir.

Exemple

exemple d'édition de pose ouverte par Qwen-Image - source
Exemple d'édition de pose ouverte par Qwen-Image - open-pose iamge
exemple d'édition de pose ouverte par Qwen-Image - édité

Invitation : "La fille de la figure 2 prend la pose de la figure 1.


Rédiger des messages d'encouragement efficaces

  1. Soyez descriptif, pas abstrait. Utilisez des détails vivants.
  2. Spécifiez les matériaux et l'éclairage. Des termes tels que " mat", " velours", " néon" favorisent le réalisme.
  3. Utilisez des signaux de position clairs.
  4. Mettez l'accent sur le ton émotionnel.
  5. Combiner le sujet et le style.
  6. Répéter et affiner.
  7. Équilibrer les images et le texte.
  8. Utiliser une terminologie artistique familière.

Cas d'utilisation pratiques

Visuels de marque ou de campagne

Photo d'un produit de soin avec nuages pastel et titre argenté "Glow Within", générée par Qwen-Image

Invitation : "Un flacon de produit de soin élégant devant de doux nuages, le titre 'Glow Within' en fines lettres argentées, des tons pastel calmes."

Présentation des produits et merchandising visuel

Baskets blanches sur sol réfléchissant avec texte "Step Ahead" ajouté par l'IA, présentation minimaliste du produit

Invitation : "Des baskets blanches placées sur un sol noir réfléchissant avec un léger éclairage, texte superposé 'Step Ahead' en sans-serif mince".

Illustrations ou affiches

Affiche AI illustrée d'un personnage sur un toit futuriste avec le titre en néon "NEXT ERA".

Prompt : "Personnage illustré se tenant sur un toit futuriste, titre en néon 'NEXT ERA' s'illuminant derrière, éclairage comique".


Qwen-Image Prompt Library

1. Affiche éditoriale moderne

Affiche AI d'un éditorial de mode représentant une femme vêtue d'un trench-coat, intitulée "THE STYLE ISSUE" et sous-titrée "Timeless Design".

"Femme en trench beige près d'une fenêtre, titre 'THE STYLE ISSUE', sous-titre 'Timeless Design'. Variante : Homme en costume, tonalité noir et blanc, titre 'L'ÉDITION DE LA CLASSE'".

2. Illustration artistique du concept

Illustration cinématique AI d'une fille sous un lampadaire dans une nuit pluvieuse

"Fille sous un réverbère par une nuit pluvieuse, atmosphère cinématographique. Variante : Garçon à côté d'une voiture de collection sous les néons".

3. Vitrine des produits

Écouteurs sans fil sur une surface mate avec lumière périphérique et titre "Sonic Clarity".

"Ecouteurs sans fil sur une surface noire mate, lumière périphérique douce, titre 'Sonic Clarity'".

4. Scène cinématographique

Scène cinématique nocturne générée par l'IA d'un homme marchant dans le brouillard avec le titre "MIDNIGHT ECHO".

"Homme marchant dans une rue brumeuse la nuit, reflet sur la route mouillée, titre 'MIDNIGHT ECHO'. Variante : Femme près d'une voiture sous un néon rouge, titre 'AFTERGLOW'.

5. Mode de vie et décoration intérieure

Salon minimal avec canapé blanc et meubles en bois, rendu AI intitulé "Calm Spaces" (Espaces calmes)

"Salon minimal avec lumière du soleil, canapé blanc et meubles en bois, texte 'Calm Spaces'".

6. Portrait artistique

Portrait d'une femme à la lumière douce et dorée dans un style pictural.

"Portrait en gros plan avec une douce lumière dorée. Les cheveux blonds flottent devant le visage, tonalité picturale.

7. Affiche graphique vintage

Affiche de moto etro AI avec dessin géométrique et titre "SPEED & GRACE".

"Affiche de moto illustrée, formes géométriques rouges et beiges, titre 'SPEED & GRACE'.


Conseils pour l'utilisation des messages-guides

  • Privilégiez les matériaux, l'éclairage et le ton plutôt que la résolution.
  • Combiner des éléments visuels et textuels.
  • Utilisez des détails spécifiques et concrets.
  • Affiner les résultats en utilisant le mode édition.
  • Veiller à ce que le style soit cohérent d'une série à l'autre.

Conclusion

Qwen-Image fusionne la compréhension du texte, la génération visuelle et l'édition précise en un seul système, ce qui permet des flux de travail créatifs et de conception de qualité professionnelle sans post-édition ni outils externes.

Le modèle a un potentiel extrêmement élevé, mais il nécessite des compétences avancées en matière de création de messages pour en tirer toute la puissance. Une autre caractéristique notable de Qwen-Image est qu'il produit des résultats relativement cohérents sur plusieurs générations utilisant la même invite. Par conséquent, nous vous recommandons de ne générer qu'une seule image par invite, ce quivous permet d'économiser des lumens et du temps de génération.

Lorsque l'image générée contient des problèmes logiques mineurs ou des détails qui doivent être affinés, vous pouvez effectuer plusieurs générations de sélection pour affiner le résultat.

Avec son nombre de paramètres de modèle de 20B, Qwen offre de vastes possibilités créatives - c'est maintenant à votre tour de libérer votre imagination. Bonne inspiration !

Tous les articles
Carte modèle Qwen-Image

Manuel Qwen-Image

Qwen-Image : Conçu pour la beauté, construit pour le contrôle Qwen-Image est un modèle de fondation de 20 milliards de paramètres construit sur l'architecture MMDiT, conçu pour la génération d'images haute-fidélité et l'édition visuelle à grain fin. Il se distingue par sa capacité à restituer des textes complexes directement dans les images, à effectuer une édition précise des images et à maintenir une cohérence remarquable entre les sujets, les mises en page et les styles. Contrairement à la plupart des modèles de génération d'images, Qwen-Image peut intégrer de manière transparente la conception visuelle et la typographie, créant ainsi un nouveau paradigme pour les créateurs de contenu, les concepteurs et les artistes qui accordent de l'importance...
Créer en ligne des photos d'identité de qualité studio

Portrait d'identité professionnel - Créez en ligne des photos d'identité de qualité studio

Dans les contextes professionnels et officiels, une photo d'identité soignée est plus qu'une simple exigence : elle est le reflet de la crédibilité, de la fiabilité et de l'attention portée aux détails. Cependant, tout le monde n'a pas accès à un studio ou n'a pas le temps de faire des retouches répétées. Avec l'outil de portrait d'identité professionnel de PicLumen, vous pouvez générer instantanément des photos d'identité nettes et de haute qualité. Le résultat reflète les normes du studio : tenue vestimentaire, arrière-plan propre et une esthétique professionnelle adaptée aux CV, aux demandes d'emploi,...
Utiliser la coloration automatique pour donner vie à votre dessin au trait

Auto Coloring - Donnez instantanément vie à vos dessins au trait

La couleur est ce qui donne à l'art sa vivacité et son impact émotionnel. Mais colorer manuellement des dessins au trait peut prendre beaucoup de temps, en particulier pour les bandes dessinées, les illustrations ou les itérations de conception rapides. Avec l'outil de coloration automatique de PicLumen, vous pouvez instantanément donner vie à vos croquis ou à vos dessins au trait grâce à une coloration automatique pilotée par l'IA. Économisez des heures de travail manuel tout en maintenant votre flux créatif ininterrompu. L'importance de la coloration automatique La coloration est une étape cruciale du flux de travail de tout artiste : Accélère la production...
Affinez vos projets en les transformant en dessins au trait nets et détaillés

Affinez vos projets en les transformant en dessins au trait nets et détaillés

Lorsqu'ils travaillent sur des illustrations, des bandes dessinées ou des concepts artistiques, les artistes commencent souvent par des ébauches ou des croquis. Bien que ces ébauches capturent l'essence d'une idée, elles peuvent manquer de clarté et de précision. Avec l'outil Raffiner de PicLumen, vous pouvez instantanément transformer des ébauches en dessins au trait nets et détaillés - des contours lisses, des détails améliorés et des résultats de qualité professionnelle prêts pour la mise en couleur ou la publication. L'importance de l'affinage du dessin au trait Le dessin au trait est la base de l'illustration numérique....
Présentation de la fonction de contrôle de la pose de PicLumen

Présentation de la fonction de contrôle de la pose de PicLumen

Qu'est-ce que le Contrôle de Pose ? Le contrôle de la pose est une nouvelle fonctionnalité de PicLumen qui vous permet de personnaliser la pose d'une personne pour vos images générées par l'IA. Parfois, vous avez une pose très spécifique à l'esprit - cette fonctionnalité permet de s'assurer que le personnage généré suit cette pose avec précision, afin que vous puissiez obtenir exactement le look que vous souhaitez. *Dans cette image, nous avons utilisé Pony Diffusion V6 pour démontrer le contrôle de la pose. Pourquoi utiliser le contrôle de la pose ? Des résultats précis : Obtenez exactement le...
un personnage fantastique aux cheveux roses

Comment vendre l'art de l'IA en ligne : Des étapes simples pour monétiser vos créations en IA

L'art généré par l'IA offre aux artistes, aux créateurs et même aux débutants des possibilités passionnantes de monétiser leur créativité. Que vous soyez un artiste numérique ou que vous découvriez les outils d'IA, la vente d'art généré par l'IA peut être un moyen gratifiant de partager vos créations et de gagner de l'argent. Ce guide vous accompagnera tout au long du processus de création, d'optimisation et de vente en ligne de vos œuvres d'art générées par l'IA, sans frais ni site web. Qu'est-ce que l'art de l'IA,...

Les meilleurs générateurs d'art par IA pour créer des images à partir de textes

Alors que les générateurs d'art d'IA continuent d'évoluer et que de nouveaux produits font leur apparition, il devient de plus en plus difficile de trouver un outil de qualité et, en l'espace de deux ou trois ans seulement, les générateurs d'art d'IA texte-image sont devenus un phénomène courant. Les outils d'art de l'IA établis gagnent du terrain et de nouvelles applications dotées de fonctions avancées font leur apparition sur le marché. Le choix d'un outil de haute qualité devient de plus en plus difficile - c'est presque comme trouver une aiguille dans...
20 meilleures bannières d'invites DnD

20 Meilleures invites DnD pour créer de superbes œuvres d'art AI DnD

Donjons et Dragons (DnD) est un royaume de créativité infinie, où les joueurs donnent vie à des héros, des méchants et des mondes grâce à leur imagination. Et si vous pouviez donner vie visuellement à ces idées ? Avec la montée en puissance du créateur d'images DnD AI, il n'a jamais été aussi facile de créer de superbes personnages DnD, des paysages à couper le souffle et des scènes de bataille épiques. Qu'il s'agisse de personnages de DnD ou de dessins de DnD, le générateur d'images de DnD AI de PicLumen...