Manuale Qwen-Image

Qwen-Image: Realizzato per la bellezza, costruito per il controllo

scheda modello qwen

Qwen-Image è un modello di base a 20 miliardi di parametri costruito sull'architettura MMDiT, progettato per la generazione di immagini ad alta fedeltà e l'editing visivo a grana fine. Si distingue per la capacità di rendere testi complessi direttamente all'interno delle immagini, di eseguire un editing preciso delle immagini e di mantenere una notevole coerenza tra soggetti, layout e stili.

A differenza della maggior parte dei modelli di generazione di immagini, Qwen-Image è in grado di integrare perfettamente il design visivo e la tipografia, creando un nuovo paradigma per i creatori di contenuti, i designer e gli artisti che apprezzano sia la libertà creativa che la precisione a livello di pixel.

PicLumen offre due modelli: Qwen-Image per la generazione di alta qualità (senza editing) e Qwen-Image-Edit per la generazione e l'editing. Scegliete il modello più adatto alle vostre esigenze.


Punti salienti

  • Text Rendering Mastery - Genera immagini che includono testo realistico e di forma corretta in più lingue e stili, mantenendo l'allineamento, la prospettiva e la coerenza dei materiali.
  • Potente pipeline di editing: modificate le immagini esistenti attraverso istruzioni di testo o riferimenti visivi, preservando la struttura, l'illuminazione e l'identità.
  • Consapevolezza del layout e della composizione - Comprende la composizione del design, consentendo il posizionamento naturale di elementi quali titoli, sottotitoli e oggetti.
  • Identità e coerenza: mantiene la coerenza dei soggetti, dei volti, dei loghi del marchio e di altre caratteristiche distintive tra più generazioni.
  • Flessibilità estetica - Capacità di produrre immagini attraverso gli stili della fotografia, dell'illustrazione, del cinema e del design grafico con un'illuminazione ricca e texture dettagliate.


1. Generazione da testo a immagine (Qwen-Image)

Panoramica
Qwen-Image accetta descrizioni puramente testuali e crea composizioni visive che incorporano tipografia, layout e stile come parte dell'immagine stessa.

Suggerimenti per il prompt

  • Specificare dove deve apparire il testo e descriverne le qualità visive.
  • Combinare i dettagli del testo con il contesto ambientale.
  • Includere suggerimenti sul materiale e sul tono.
  • Citate concetti di design come lo stile dei manifesti editoriali o l'estetica art-deco.

Esempio

Pubblicità di un profumo generata dall'intelligenza artificiale con bottiglia di vetro su piedistallo di marmo, testo serif dorato "Eau d'Élégance", creato dal modello Qwen-Image

Prompt: Pubblicità di un profumo di fascia alta con un flacone di vetro con tappo dorato su un piedistallo di marmo, circondato da una soffice nebbia. Un testo serif elegante e di grandi dimensioni sulla metà superiore recita "Eau d'Élégance" in oro metallizzato; sotto, una sottile tagline: "Essence of Timeless Beauty" (Essenza di bellezza senza tempo) in caratteri bianchi e sottili.


2. Modifica delle immagini (Qwen-Image-Edit)

Panoramica
La modalità di modifica di Qwen-Image consente agli utenti di modificare un'immagine esistente attraverso istruzioni descrittive - come alterare gli sfondi, cambiare i materiali, regolare l'illuminazione o aggiungere testo - preservando l'integrità del soggetto originale.

Suggerimenti per il prompt

  • Descrivete esplicitamente cosa mantenere invariato.
  • Descrivete con precisione la modifica.
  • Chiarire l'umore e il tono.
  • Includere suggerimenti posizionali come l'angolo in alto a destra o la sovrapposizione del titolo allineato al centro.

Esempi

Cuffie nere opache modificate dall'intelligenza artificiale su sfondo di muro di cemento con testo bianco "Pure Sound", foto del prodotto migliorata da Qwen-Image - fonte
Cuffie nere opache modificate dall'intelligenza artificiale su sfondo di muro di cemento con testo bianco "Pure Sound", foto del prodotto migliorata da Qwen-Image -edited

Prompt: "Mantenete il prodotto identico, sostituite lo sfondo con un muro di cemento testurizzato illuminato da una luce laterale soffusa e sovrapponete la frase 'Pure Sound' in un sottile carattere serif bianco vicino alla parte inferiore".

Foto di tazza di caffè modificata con AI per aggiungere il testo dorato "Morning Ritual" e lo sfondo luminoso della cucina - fonte
Foto della tazza di caffè modificata con AI per aggiungere il testo dorato "Rituale del mattino" e lo sfondo luminoso della cucina - modificato

Prompt: Modificare la tazza di caffè su un tavolo di legno, mantenendone la forma e il logo. Sostituite lo sfondo con un'ambientazione luminosa della cucina e aggiungete un sottile testo in rilievo in oro "Morning Ritual" sulla tazza.

Immagine composita AI che fonde un ritratto di moda con il tramonto sulla spiaggia, con riflessi caldi sugli occhiali da sole, creata da Qwen-Image - fonte
Immagine composita AI che fonde il ritratto di moda con il tramonto sulla spiaggia, riflessi caldi sugli occhiali da sole creata da Qwen-Image - modificata

Prompt: Sostituite il ragazzo dell'immagine con una ragazza anime dai lunghi capelli neri, mantenendo invariati i vestiti e le altre parti.

Modifica di più fasi da Qwen-Image

Prompt 1: stare in piedi con una mano sul fianco e l'altra a formare un segno a V.

Prompt 2: Formate un cuore con entrambe le mani.

Prompt 3: tenere con entrambe le mani una piccola lavagna con la scritta "Welcome to PicLumen".

Prompt 4: avvicinare la telecamera.


3. Modifica di più immagini

Panoramica
Qwen-Image-Edit supporta la combinazione di più ingressi di immagini, unendo soggetti e ambienti in scene coerenti.

Suggerimenti per il prompt

  • Descrivete il ruolo di ciascuna immagine.
  • Definire le modalità di fusione.
  • Mantenere il realismo.
  • Aggiungete una direzione stilistica come la luce cinematografica o la composizione editoriale.

Esempio

Immagine composita AI che fonde il ritratto di moda con il tramonto sulla spiaggia, con riflessi caldi sugli occhiali da sole creata da Qwen-Image

Prompt: "La donna della Figura 2 prende il sole sulla sedia a sdraio della Figura 1 indossando gli occhiali da sole".


4. Trasferimento di stile e trasformazione della vista

Panoramica
Qwen-Image supporta la reinterpretazione stilistica e la trasformazione del punto di vista, trasformando le immagini esistenti in nuove composizioni artistiche o cinematografiche e preservando l'integrità strutturale.

Suggerimenti per il prompt

  • Indicare sia lo stile di partenza che quello di arrivo.
  • Definire il nuovo angolo o punto di vista della telecamera.
  • Includere spunti di luce e tono.
  • Utilizzate riferimenti artistici come poster pop-art o fumetti disegnati a mano.

Esempio
 

Trasformazione AI che trasforma un ritratto di strada in un poster pop-art con texture a mezzatinta e colori vivaci - fonte
Trasformazione AI che trasforma un ritratto di strada in un poster pop-art con texture a mezzatinta e colori vivaci - modificato

Prompt: "Trasforma l'immagine in un poster 2D in stile anime con contorni spessi e blocchi di colore decisi; conserva i dettagli della posa e dell'abbigliamento".

Prompt: Trasformare l'immagine in uno schizzo a matita monocromatico in bianco e nero.


5. Modifica del testo nell'immagine

Panoramica
Qwen-Image-Edit è in grado di modificare e sostituire il testo direttamente all'interno delle immagini, conservando il carattere originale, il posizionamento e gli effetti come le ombre e la lucentezza metallica. Il suo vantaggio rispetto ad altri modelli sta nella capacità di gestire testi più complessi, come quelli in cinese, giapponese e coreano.

Suggerimenti per il prompt

  • Descrivere lo stile di testo esistente.
  • Specificare cosa modificare.
  • Menzionare raffinatezze come il bagliore o la tonalità del colore.
  • Mantenere precisi gli spunti di layout.

Esempio

Cartellone pubblicitario modificato dall'intelligenza artificiale che sostituisce la scritta "SUMMER SALE" con "HOLIDAY LAUNCH" mantenendo il font e le ombre - fonte
Cartellone pubblicitario modificato con l'AI che sostituisce "SUMMER SALE" con "HOLIDAY LAUNCH" mantenendo font e ombre - modificato

Prompt: "Cambiate il testo "SUMMER SALE" in "HOLIDAY LAUNCH" mantenendo identici font, dimensioni e ombreggiatura".

Qwen-Image-Edit può anche supportare la sostituzione di testo complesso.

esempio di modifica del testo da Qwen-Image - fonte
esempio di modifica del testo da Qwen-Image - modificato

Prompt: Modificare il testo "Accessori per la vita estiva" in "夏日生活搭子".

rendering di testo complesso da parte di Qwen-Image

Prompt: Tre ragazze anime con in mano tre cartelli con scritto "欢迎光临", "ようこそ" e "환영합니다", ognuna con diverse espressioni facciali, in piedi davanti allo sfondo di un caffè.


6. Controllo avanzato

Panoramica
Ora siamo arrivati alla parte che preferisco: Qwen-Image-Edit supporta il condizionamento in stile ControlNet, simile a quello dell'era SDXL. Ancora meglio, supporta nativamente tre potenti modalità contemporaneamente: OpenPose, Depth e Canny.

Suggerimenti per il prompt

  • Preparare l'immagine che si desidera utilizzare per il controllo. (In PicLumen, utilizzare Riferimento immagine invece di Controllo immaginepoiché Qwen è guidato direttamente dall'immagine stessa piuttosto che da una tradizionale pipeline ControlNet).
  • Descrivete chiaramente il risultato visivo o l'effetto che volete ottenere.

Esempio

esempio di modifica di una posa aperta da Qwen-Image - fonte
esempio di modifica della posa aperta da Qwen-Image - open-pose iamge
esempio di modifica della posa aperta da Qwen-Image - modificato

Prompt: "La ragazza della Figura 2 è cambiata nella posa della Figura 1".


Creare suggerimenti efficaci

  1. Siate descrittivi, non astratti. Utilizzate dettagli vividi.
  2. Specificare i materiali e l'illuminazione. Termini come opaco, velluto, neon luminoso aiutano il realismo.
  3. Utilizzate indicazioni posizionali chiare.
  4. Enfatizzare il tono emotivo.
  5. Combinare soggetto e stile.
  6. Iterare e perfezionare.
  7. Bilanciare immagini e testo.
  8. Sfruttare la terminologia artistica conosciuta.

Casi d'uso pratici

Immagini del marchio o della campagna

Foto di un prodotto per la cura della pelle con nuvole pastello e titolo argentato "Glow Within", generata da Qwen-Image

Prompt: "Un elegante flacone di prodotto per la cura della pelle davanti a soffici nuvole, il testo del titolo 'Glow Within' in sottili lettere d'argento, calme tonalità pastello".

Vetrina dei prodotti e visual merchandising

Sneakers bianche su pavimento riflettente con testo in sovrimpressione "Step Ahead" aggiunto dall'AI, vetrina di prodotto minimalista

Prompt: "Scarpe da ginnastica bianche appoggiate su un pavimento nero riflettente con un leggero riflettore, testo in sovrimpressione 'Step Ahead' in sans-serif sottile".

Illustrati o poster

Poster illustrato AI di un personaggio su un tetto futuristico con titolo al neon "NEXT ERA".

Prompt: "Personaggio illustrato in piedi su un tetto futuristico, titolo al neon 'NEXT ERA' che brilla dietro, illuminazione da fumetto".


Biblioteca dei prompt di immagini Qwen

1. Poster editoriale moderno

Poster editoriale di moda AI di donna in trench intitolato 'THE STYLE ISSUE' con sottotitolo 'Design senza tempo'.

"Donna con trench beige vicino a una finestra, titolo 'THE STYLE ISSUE', sottotitolo 'Timeless Design'" . Variante: Uomo in abito, tono bianco e nero, titolo 'THE CLASS EDITION'" .

2. Illustrazione di concetti artistici

Illustrazione AI cinematografica di ragazza sotto il lampione in una notte di pioggia

"Ragazza sotto un lampione in una notte di pioggia, atmosfera cinematografica". Variante: Ragazzo accanto a un'auto d'epoca sotto le luci al neon".

3. Vetrina dei prodotti

Auricolari wireless su superficie opaca con luce sul bordo e titolo "Sonic Clarity".

"Auricolari wireless su superficie nera opaca, luce morbida sul bordo, titolo 'Sonic Clarity'".

4. Scena cinematografica

Scena notturna generata dall'intelligenza artificiale di un uomo che cammina nella nebbia con il titolo "MIDNIGHT ECHO".

"Uomo che cammina in una strada nebbiosa di notte, riflesso sulla strada bagnata, titolo 'MIDNIGHT ECHO'" . Variante: Donna vicino all'auto sotto una luce al neon rossa, titolo 'AFTERGLOW'" .

5. Stile di vita e design d'interni

Soggiorno minimalista con divano bianco e mobili in legno, rendering AI intitolato "Calm Spaces".

"Soggiorno minimalista con luce solare, divano bianco e mobili in legno, testo 'Spazi Calmi'".

6. Ritratto artistico

Ritratto di donna con luce dorata e morbida in stile pittorico

"Ritratto estremo ravvicinato con luce morbida e dorata, i capelli biondi svolazzano davanti al viso, tono pittorico".

7. Poster grafico d'epoca

poster per moto etro AI con disegno geometrico e titolo "SPEED & GRACE".

"Poster illustrato di motociclette, forme geometriche rosse e beige, titolo 'SPEED & GRACE'" .


Suggerimenti per l'uso dei suggerimenti

  • Concentratevi su materiali, illuminazione e tono piuttosto che sulla risoluzione.
  • Combinare elementi visivi e testuali.
  • Utilizzate dettagli specifici e concreti.
  • Perfezionare i risultati utilizzando la modalità di modifica.
  • Mantenere uno stile coerente tra le varie serie.

Conclusione

Qwen-Image fonde la comprensione del testo, la generazione visiva e l'editing preciso in un unico sistema, consentendo flussi di lavoro creativi e di design di qualità professionale senza post-editing o strumenti esterni.

Il modello ha un potenziale estremamente elevato, ma richiede capacità avanzate di creazione di prompt per poterne sfruttare appieno la potenza. Un'altra caratteristica degna di nota di Qwen-Image è che produce risultati relativamente coerenti tra più generazioni utilizzando lo stesso prompt. Per questo motivo, si consiglia di generare unasola immagine per ogni prompt: ciòconsente di risparmiare sia Lumens che tempo di generazione.

Quando l'immagine generata contiene piccoli problemi logici o dettagli che devono essere perfezionati, è possibile eseguire diverse generazioni cherry-pick per perfezionare il risultato.

Con i suoi 20B parametri di modello, Qwen offre vaste possibilità creative: ora tocca a voi scatenare la vostra immaginazione. Buon divertimento!

Tutti gli articoli
Scheda modello Qwen-Image

Manuale Qwen-Image

Qwen-Image: Crafted for Beauty, Built for Control Qwen-Image è un modello di base a 20 miliardi di parametri costruito sull'architettura MMDiT, progettato per la generazione di immagini ad alta fedeltà e per l'editing visivo a grana fine. Si distingue per la capacità di rendere testi complessi direttamente all'interno delle immagini, di eseguire un editing preciso delle immagini e di mantenere una notevole coerenza tra soggetti, layout e stili. A differenza della maggior parte dei modelli di generazione di immagini, Qwen-Image è in grado di integrare perfettamente il design visivo e la tipografia, creando un nuovo paradigma per i creatori di contenuti, i designer e gli artisti che...
Creare fototessere di qualità da studio online

Ritratto ID professionale - Creare foto ID di qualità da studio online

In contesti professionali e ufficiali, una fototessera curata è più di un semplice requisito: è un riflesso di credibilità, affidabilità e attenzione ai dettagli. Tuttavia, non tutti hanno accesso a uno studio fotografico o il tempo per ripetere le foto. Con lo strumento Ritratto ID professionale di PicLumen, è possibile generare istantaneamente foto in stile ID pulite e di alta qualità. Il risultato rispecchia gli standard dello studio: abbigliamento formale, sfondi puliti e un'estetica professionale adatta a curriculum, domande di lavoro,...
Usare la colorazione automatica per dare vita ai disegni al tratto

Colorazione automatica: per dare vita istantaneamente alle vostre linee di disegno

Il colore è ciò che dà all'arte la sua vivacità e il suo impatto emotivo. Ma colorare manualmente le line art può richiedere molto tempo, soprattutto per i fumetti, le illustrazioni o le veloci iterazioni di design. Con lo strumento di colorazione automatica di PicLumen, è possibile dare vita istantaneamente a schizzi o linee d'arte con una colorazione automatica potenziata dall'intelligenza artificiale. Risparmiate ore di lavoro manuale e mantenete il vostro flusso creativo senza interruzioni. Perché la colorazione automatica è importante La colorazione è una fase cruciale del flusso di lavoro di ogni artista: Accelera la produzione...
Perfezionare le bozze in linee pulite e dettagliate

Perfezionare le bozze in linee pulite e dettagliate

Quando lavorano a illustrazioni, fumetti o concept art, gli artisti iniziano spesso con bozze o schizzi. Sebbene queste bozze catturino l'essenza di un'idea, possono mancare di chiarezza e di nitidezza. Con lo strumento Refine di PicLumen, è possibile trasformare istantaneamente bozze di linea in line art pulite e dettagliate: contorni uniformi, dettagli migliorati e risultati di qualità professionale pronti per la colorazione o la pubblicazione. Perché il perfezionamento delle line art è importante Le line art sono il fondamento dell'illustrazione digitale....
Presentazione della funzione di controllo della posa di PicLumen

Presentazione della funzione di controllo della posa di PicLumen

Cos'è il controllo della posa? Pose Control è una nuova funzione di PicLumen che consente di personalizzare la posa di una persona per le immagini generate dall'intelligenza artificiale. A volte avete in mente una posa molto specifica: questa funzione fa in modo che il personaggio generato la segua con precisione, in modo da ottenere esattamente l'aspetto che desiderate. *In questa immagine, abbiamo usato Pony Diffusion V6 per dimostrare il controllo della posa. Perché usare il controllo della posa? Risultati precisi: Ottenete esattamente la...
un personaggio di fantasia con i capelli rosa

Come vendere arte AI online: Semplici passi per monetizzare le vostre creazioni AI

L'arte generata dall'IA ha aperto agli artisti, ai creatori e anche ai principianti interessanti opportunità di monetizzare la propria creatività. Sia che siate artisti digitali o che stiate semplicemente esplorando gli strumenti di IA, vendere arte generata dall'IA può essere un modo gratificante per condividere le vostre creazioni e guadagnare. Questa guida vi guiderà attraverso il processo di creazione, ottimizzazione e vendita online della vostra arte generata dall'IA, senza costi né siti web. Cos'è l'AI Art,...

I migliori generatori di arte artificiale per creare immagini da suggerimenti di testo

Con la continua evoluzione dei generatori di AI art e l'ingresso di nuovi prodotti, trovare uno strumento di qualità diventa sempre più complicato e in soli due o tre anni i generatori di AI art da testo a immagine sono diventati un fenomeno comune. Gli strumenti di AI art già affermati stanno guadagnando terreno e nuove applicazioni dotate di funzioni avanzate stanno entrando nel mercato. La scelta di uno strumento di alta qualità sta diventando sempre più difficile, quasi come...
20 migliori banner di prompts di DnD

I 20 migliori suggerimenti di DnD per creare un'arte AI straordinaria di DnD

Dungeons & Dragons (DnD) è un regno di creatività infinita, dove i giocatori danno vita a eroi, cattivi e mondi attraverso la loro immaginazione. E se si potesse dare vita visivamente a queste idee? Con l'avvento di DnD AI image creater, creare personaggi DnD straordinari, paesaggi mozzafiato e scene di battaglia epiche non è mai stato così facile. Sia che stiate esplorando i suggerimenti per i personaggi di DnD o i suggerimenti per i disegni di DnD, il generatore di immagini di DnD AI di PicLumen...