Qwen-Image:為美而生,為控制而生

Qwen-Image 是建立在MMDiT 架構上的200 億個參數基礎模型,專為高保真圖像生成和精細的視覺編輯而設計。它能直接在圖像中渲染複雜的文字、執行精確的圖像編輯,並在不同的主題、版面和樣式中保持顯著的一致性。
與大多數圖像製作模型不同,Qwen-Image 可以無縫整合視覺設計和排版- 為重視創意自由和像素級精確度的內容創造者、設計師和藝術家創造了一個新的範例。
在 PicLumen,我們提供兩種模式:Qwen-Image用於高品質的生成(無需編輯),Qwen-Image-Edit用於生成和編輯。請選擇最適合您需求的模式。
重點介紹
- 文字渲染精通- 以多種語言和樣式產生包含逼真、形狀正確文字的影像,並維持對齊、透視和材質的一致性。
- 功能強大的編輯管道- 可透過文字指示或視覺參考編輯現有影像,同時保留結構、照明和身分。
- 版面與構圖意識- 瞭解設計構圖,讓標題、字幕和物件等元素自然放置。
- 身分識別與一致性- 跨世代維持主題、面孔、品牌標誌和其他鮮明特徵的一致性。
- 美學上的彈性- 能夠製作跨越攝影、插圖、電影和平面設計風格的影像,並擁有豐富的光線和細膩的紋理。
1.文字轉影像產生 (Qwen-Image)
概述
Qwen-Image 接受純文字描述,並創造視覺構圖,將排版、佈局和風格融入圖像本身。
提示技巧
- 指定文字應該出現的位置,並描述其視覺特質。
- 結合文字細節與環境背景。
- 包括素材和語調提示。
- 提及設計概念,例如社論海報風格或裝飾藝術美學。
範例

提示:高檔香水廣告,大理石基座上有一個帶金色瓶蓋的玻璃瓶,四周環繞著柔和的霧氣。上半部的大型優雅襯線體文字以金屬金色書寫「Eau d'Élégance」;下方的精細標語:「Essence of Timeless Beauty」以細緻的白色字體書寫。
2.圖片編輯 (Qwen-Image-Edit)
概述
Qwen-Image 的編輯模式可讓使用者透過描述性的指示來修改現有的影像 - 例如改變背景、改變材質、調整光線或加入文字,同時保留原始主題的完整性。
提示技巧
- 明確說明保持不變的內容。
- 精確描述修改。
- 澄清情緒和語氣。
- 包含位置提示,例如右上角或居中對齊的標題覆蓋。
範例


提示:"保持產品相同,將背景換成由柔和側光照亮的質感混凝土牆,並在底部附近以細白襯線字體覆蓋短語'Pure Sound'"。


提示:編輯木桌上的咖啡杯,保留其形狀與標誌。將背景換成明亮的廚房佈景,並在杯子上加入微妙的浮雕金色文字「Morning Ritual」。


提示:將圖中的男孩換成黑色長髮的動漫女孩,衣服和其他部分保持不變。

提示 1:站立,一隻手放在臀部,另一隻手成 V 字型。
提示 2:用雙手塑造一個心形。
提示 3:雙手拿著寫有「歡迎來到 PicLumen」的小黑板。
提示 4:將攝影機拉近。
3.多影像編輯
概觀
Qwen-Image-Edit 支援結合多個影像輸入- 將主體和環境合併為一致的場景。
提示技巧
- 描述每個影像的角色。
- 定義它們應該如何合併。
- 保持現實。
- 加入風格方向,如電影光線或編輯構圖。
範例

提示:「圖 2 中的女性戴著太陽眼鏡在圖 1 中的躺椅上享受日光浴」。
4.樣式轉移和視圖轉換
概述
Qwen-Image 支援風格重新詮釋和視點轉換 - 將現有的視覺效果轉換為新的藝術或電影構成,同時保留結構的完整性。
提示技巧
- 同時提及來源和目標樣式。
- 定義新的攝影角度或觀點。
- 包括燈光和音調提示。
- 使用波普藝術海報或手繪漫畫風格等藝術參考。
範例


提示:"將圖像轉換成 2D 動漫風格的海報,使用粗線條和大膽的色塊;保留姿勢和服裝細節。


提示:將圖像轉換成黑白單色鉛筆素描風格。
5.圖中文字編輯
概述
Qwen-Image-Edit 可以直接編輯和替換圖像中的文字 - 保留原始字體、位置和效果,例如陰影和金屬光澤。與其他機型相比,它的優勢在於能夠處理更複雜的文字,例如中文、日文和韓文。
提示技巧
- 描述現有的文字樣式。
- 指定要變更的內容。
- 提及光澤或色調等細節。
- 保持精確的佈局提示。
範例


提示:「將文字 」SUMMER SALE「 改為 」HOLIDAY LAUNCH「,同時保持字型、大小和陰影相同」。
Qwen-Image-Edit 也可以支援複雜的文字替換。


提示:將文字 "Summer life accessories「 改為 」夏日生活搭子"

提示:三個動漫女孩手持三個標誌,分別寫著 「歡迎光临」、"ようこそ 「和 」환영합니다",各自帶著不同的臉部表情,站在咖啡館背景前。
6.進階控制
概述
現在到了我最喜歡的部分 - Qwen-Image-Edit 支援類似 SDXL 時代的 ControlNet 式調節。更棒的是,它同時原生支援三種強大的模式:OpenPose、Depth 和Canny。
提示技巧
- 準備您要用來控制的影像。(在 PicLumen 中,使用 影像參考 而不是 圖片控制,因為 Qwen 是直接由影像本身引導,而不是傳統的 ControlNet 管線)。
- 清楚描述您想要達到的視覺結果或效果。
範例



提示:「圖 2 中的女孩改成圖 1 中的姿勢」
撰寫有效的提示
- 要描述,不要抽象。使用生動的細節。
- 指定材質和燈光。 霧面、天鵝絨、霓虹燈等詞彙有助於逼真度。
- 使用清楚的位置提示。
- 強調情感語調。
- 結合主題與風格。
- 迭代和改進。
- 平衡視覺與文字。
- 利用熟悉的藝術術語。
實用案例
品牌或活動視覺

提示:"柔和的雲層前有一個光滑的護膚品瓶子,標題文字'Glow Within'是纖細的銀色字體,恬靜的粉彩色調"。
產品展示與視覺行銷

提示:"白色運動鞋放置在反光的黑色地板上,配以柔和的聚光燈,覆蓋文字'Step Ahead',使用纖細的無襯線字體"。
插圖或海報藝術

提示:"圖中人物站在未來感十足的屋頂上,霓虹燈標題'NEXT ERA'在後面發光,漫畫式燈光"。
Qwen-Image Prompt Library
1.現代社論海報

"穿著米色風衣的女人在窗邊,標題'THE STYLE ISSUE「,副標題」Timeless Design'"。變化:身穿西裝的男子,黑白色調,標題'THE CLASS EDITION'"。
2.藝術概念插畫

「雨夜街燈下的女孩,電影般的氛圍」。變化:霓虹燈下老爺車旁的男孩"。
3.產品展示

"黑色霧面的無線耳塞,柔和的邊緣燈,標題'Sonic Clarity'"。
4.電影場景

"男人在夜晚穿過霧氣瀰漫的街道,倒影在濕漉漉的路面上,標題'MIDNIGHT ECHO'"。變體:紅色霓虹燈下汽車旁的女子,標題'AFTERGLOW'"。
5.生活方式與室內設計

"有陽光、白色沙發和木質家具的極簡客廳,文字為「平靜空間」"。
6.藝術肖像

「極近距離的肖像,柔和的金色光線,金色的頭髮在臉前飄動,繪畫般的色調」。
7.復古平面海報

"插圖摩托車海報,幾何圖形的紅色和米色,標題'SPEED & GRACE'"。
使用提示的提示
- 專注於材質、光線和色調,而非解析度。
- 將視覺和文字元素結合在一起。
- 使用具體、具體的細節。
- 使用編輯模式精煉結果。
- 保持各系列風格一致。
結論
Qwen-Image 將文字理解、視覺生成和精確編輯融合到一個系統中,無需後期編輯或外部工具即可實現專業品質的創意和設計工作流程。
此模型具有極高的潛力,但需要先進的提示製作技巧才能發揮其全部威力。Qwen-Image 的另一個顯著特點是,使用相同的提示,它可以在多個世代中產生相對一致的結果。因此,我們建議您每個提示只生成一張圖像,這樣可以幫助您節省流明和生成時間。
當產生的影像包含需要改進的細微邏輯問題或細節時,您可以執行多次挑選世代來微調結果。
Qwen 擁有 20B 的模型參數,提供極大的創作可能性 - 現在輪到您釋放想像力了。祝您提示愉快!