Qwen-Image: Realizzato per la bellezza, costruito per il controllo

Qwen-Image è un modello di base a 20 miliardi di parametri costruito sull'architettura MMDiT, progettato per la generazione di immagini ad alta fedeltà e l'editing visivo a grana fine. Si distingue per la capacità di rendere testi complessi direttamente all'interno delle immagini, di eseguire un editing preciso delle immagini e di mantenere una notevole coerenza tra soggetti, layout e stili.
A differenza della maggior parte dei modelli di generazione di immagini, Qwen-Image è in grado di integrare perfettamente il design visivo e la tipografia, creando un nuovo paradigma per i creatori di contenuti, i designer e gli artisti che apprezzano sia la libertà creativa che la precisione a livello di pixel.
PicLumen offre due modelli: Qwen-Image per la generazione di alta qualità (senza editing) e Qwen-Image-Edit per la generazione e l'editing. Scegliete il modello più adatto alle vostre esigenze.
Punti salienti
- Text Rendering Mastery - Genera immagini che includono testo realistico e di forma corretta in più lingue e stili, mantenendo l'allineamento, la prospettiva e la coerenza dei materiali.
- Potente pipeline di editing: modificate le immagini esistenti attraverso istruzioni di testo o riferimenti visivi, preservando la struttura, l'illuminazione e l'identità.
- Consapevolezza del layout e della composizione - Comprende la composizione del design, consentendo il posizionamento naturale di elementi quali titoli, sottotitoli e oggetti.
- Identità e coerenza: mantiene la coerenza dei soggetti, dei volti, dei loghi del marchio e di altre caratteristiche distintive tra più generazioni.
- Flessibilità estetica - Capacità di produrre immagini attraverso gli stili della fotografia, dell'illustrazione, del cinema e del design grafico con un'illuminazione ricca e texture dettagliate.
1. Generazione da testo a immagine (Qwen-Image)
Panoramica
Qwen-Image accetta descrizioni puramente testuali e crea composizioni visive che incorporano tipografia, layout e stile come parte dell'immagine stessa.
Suggerimenti per il prompt
- Specificare dove deve apparire il testo e descriverne le qualità visive.
- Combinare i dettagli del testo con il contesto ambientale.
- Includere suggerimenti sul materiale e sul tono.
- Citate concetti di design come lo stile dei manifesti editoriali o l'estetica art-deco.
Esempio

Prompt: Pubblicità di un profumo di fascia alta con un flacone di vetro con tappo dorato su un piedistallo di marmo, circondato da una soffice nebbia. Un testo serif elegante e di grandi dimensioni sulla metà superiore recita "Eau d'Élégance" in oro metallizzato; sotto, una sottile tagline: "Essence of Timeless Beauty" (Essenza di bellezza senza tempo) in caratteri bianchi e sottili.
2. Modifica delle immagini (Qwen-Image-Edit)
Panoramica
La modalità di modifica di Qwen-Image consente agli utenti di modificare un'immagine esistente attraverso istruzioni descrittive - come alterare gli sfondi, cambiare i materiali, regolare l'illuminazione o aggiungere testo - preservando l'integrità del soggetto originale.
Suggerimenti per il prompt
- Descrivete esplicitamente cosa mantenere invariato.
- Descrivete con precisione la modifica.
- Chiarire l'umore e il tono.
- Includere suggerimenti posizionali come l'angolo in alto a destra o la sovrapposizione del titolo allineato al centro.
Esempi


Prompt: "Mantenete il prodotto identico, sostituite lo sfondo con un muro di cemento testurizzato illuminato da una luce laterale soffusa e sovrapponete la frase 'Pure Sound' in un sottile carattere serif bianco vicino alla parte inferiore".


Prompt: Modificare la tazza di caffè su un tavolo di legno, mantenendone la forma e il logo. Sostituite lo sfondo con un'ambientazione luminosa della cucina e aggiungete un sottile testo in rilievo in oro "Morning Ritual" sulla tazza.


Prompt: Sostituite il ragazzo dell'immagine con una ragazza anime dai lunghi capelli neri, mantenendo invariati i vestiti e le altre parti.

Prompt 1: stare in piedi con una mano sul fianco e l'altra a formare un segno a V.
Prompt 2: Formate un cuore con entrambe le mani.
Prompt 3: tenere con entrambe le mani una piccola lavagna con la scritta "Welcome to PicLumen".
Prompt 4: avvicinare la telecamera.
3. Modifica di più immagini
Panoramica
Qwen-Image-Edit supporta la combinazione di più ingressi di immagini, unendo soggetti e ambienti in scene coerenti.
Suggerimenti per il prompt
- Descrivete il ruolo di ciascuna immagine.
- Definire le modalità di fusione.
- Mantenere il realismo.
- Aggiungete una direzione stilistica come la luce cinematografica o la composizione editoriale.
Esempio

Prompt: "La donna della Figura 2 prende il sole sulla sedia a sdraio della Figura 1 indossando gli occhiali da sole".
4. Trasferimento di stile e trasformazione della vista
Panoramica
Qwen-Image supporta la reinterpretazione stilistica e la trasformazione del punto di vista, trasformando le immagini esistenti in nuove composizioni artistiche o cinematografiche e preservando l'integrità strutturale.
Suggerimenti per il prompt
- Indicare sia lo stile di partenza che quello di arrivo.
- Definire il nuovo angolo o punto di vista della telecamera.
- Includere spunti di luce e tono.
- Utilizzate riferimenti artistici come poster pop-art o fumetti disegnati a mano.
Esempio


Prompt: "Trasforma l'immagine in un poster 2D in stile anime con contorni spessi e blocchi di colore decisi; conserva i dettagli della posa e dell'abbigliamento".


Prompt: Trasformare l'immagine in uno schizzo a matita monocromatico in bianco e nero.
5. Modifica del testo nell'immagine
Panoramica
Qwen-Image-Edit è in grado di modificare e sostituire il testo direttamente all'interno delle immagini, conservando il carattere originale, il posizionamento e gli effetti come le ombre e la lucentezza metallica. Il suo vantaggio rispetto ad altri modelli sta nella capacità di gestire testi più complessi, come quelli in cinese, giapponese e coreano.
Suggerimenti per il prompt
- Descrivere lo stile di testo esistente.
- Specificare cosa modificare.
- Menzionare raffinatezze come il bagliore o la tonalità del colore.
- Mantenere precisi gli spunti di layout.
Esempio


Prompt: "Cambiate il testo "SUMMER SALE" in "HOLIDAY LAUNCH" mantenendo identici font, dimensioni e ombreggiatura".
Qwen-Image-Edit può anche supportare la sostituzione di testo complesso.


Prompt: Modificare il testo "Accessori per la vita estiva" in "夏日生活搭子".

Prompt: Tre ragazze anime con in mano tre cartelli con scritto "欢迎光临", "ようこそ" e "환영합니다", ognuna con diverse espressioni facciali, in piedi davanti allo sfondo di un caffè.
6. Controllo avanzato
Panoramica
Ora siamo arrivati alla parte che preferisco: Qwen-Image-Edit supporta il condizionamento in stile ControlNet, simile a quello dell'era SDXL. Ancora meglio, supporta nativamente tre potenti modalità contemporaneamente: OpenPose, Depth e Canny.
Suggerimenti per il prompt
- Preparare l'immagine che si desidera utilizzare per il controllo. (In PicLumen, utilizzare Riferimento immagine invece di Controllo immaginepoiché Qwen è guidato direttamente dall'immagine stessa piuttosto che da una tradizionale pipeline ControlNet).
- Descrivete chiaramente il risultato visivo o l'effetto che volete ottenere.
Esempio



Prompt: "La ragazza della Figura 2 è cambiata nella posa della Figura 1".
Creare suggerimenti efficaci
- Siate descrittivi, non astratti. Utilizzate dettagli vividi.
- Specificare i materiali e l'illuminazione. Termini come opaco, velluto, neon luminoso aiutano il realismo.
- Utilizzate indicazioni posizionali chiare.
- Enfatizzare il tono emotivo.
- Combinare soggetto e stile.
- Iterare e perfezionare.
- Bilanciare immagini e testo.
- Sfruttare la terminologia artistica conosciuta.
Casi d'uso pratici
Immagini del marchio o della campagna

Prompt: "Un elegante flacone di prodotto per la cura della pelle davanti a soffici nuvole, il testo del titolo 'Glow Within' in sottili lettere d'argento, calme tonalità pastello".
Vetrina dei prodotti e visual merchandising

Prompt: "Scarpe da ginnastica bianche appoggiate su un pavimento nero riflettente con un leggero riflettore, testo in sovrimpressione 'Step Ahead' in sans-serif sottile".
Illustrati o poster

Prompt: "Personaggio illustrato in piedi su un tetto futuristico, titolo al neon 'NEXT ERA' che brilla dietro, illuminazione da fumetto".
Biblioteca dei prompt di immagini Qwen
1. Poster editoriale moderno

"Donna con trench beige vicino a una finestra, titolo 'THE STYLE ISSUE', sottotitolo 'Timeless Design'" . Variante: Uomo in abito, tono bianco e nero, titolo 'THE CLASS EDITION'" .
2. Illustrazione di concetti artistici

"Ragazza sotto un lampione in una notte di pioggia, atmosfera cinematografica". Variante: Ragazzo accanto a un'auto d'epoca sotto le luci al neon".
3. Vetrina dei prodotti

"Auricolari wireless su superficie nera opaca, luce morbida sul bordo, titolo 'Sonic Clarity'".
4. Scena cinematografica

"Uomo che cammina in una strada nebbiosa di notte, riflesso sulla strada bagnata, titolo 'MIDNIGHT ECHO'" . Variante: Donna vicino all'auto sotto una luce al neon rossa, titolo 'AFTERGLOW'" .
5. Stile di vita e design d'interni

"Soggiorno minimalista con luce solare, divano bianco e mobili in legno, testo 'Spazi Calmi'".
6. Ritratto artistico

"Ritratto estremo ravvicinato con luce morbida e dorata, i capelli biondi svolazzano davanti al viso, tono pittorico".
7. Poster grafico d'epoca

"Poster illustrato di motociclette, forme geometriche rosse e beige, titolo 'SPEED & GRACE'" .
Suggerimenti per l'uso dei suggerimenti
- Concentratevi su materiali, illuminazione e tono piuttosto che sulla risoluzione.
- Combinare elementi visivi e testuali.
- Utilizzate dettagli specifici e concreti.
- Perfezionare i risultati utilizzando la modalità di modifica.
- Mantenere uno stile coerente tra le varie serie.
Conclusione
Qwen-Image fonde la comprensione del testo, la generazione visiva e l'editing preciso in un unico sistema, consentendo flussi di lavoro creativi e di design di qualità professionale senza post-editing o strumenti esterni.
Il modello ha un potenziale estremamente elevato, ma richiede capacità avanzate di creazione di prompt per poterne sfruttare appieno la potenza. Un'altra caratteristica degna di nota di Qwen-Image è che produce risultati relativamente coerenti tra più generazioni utilizzando lo stesso prompt. Per questo motivo, si consiglia di generare unasola immagine per ogni prompt: ciòconsente di risparmiare sia Lumens che tempo di generazione.
Quando l'immagine generata contiene piccoli problemi logici o dettagli che devono essere perfezionati, è possibile eseguire diverse generazioni cherry-pick per perfezionare il risultato.
Con i suoi 20B parametri di modello, Qwen offre vaste possibilità creative: ora tocca a voi scatenare la vostra immaginazione. Buon divertimento!