Qwen-Image 手冊

Qwen-Image:為美而生,為控制而生

qwen 模型卡

Qwen-Image 是建立在MMDiT 架構上的200 億個參數基礎模型,專為高保真圖像生成和精細的視覺編輯而設計。它能直接在圖像中渲染複雜的文字、執行精確的圖像編輯,並在不同的主題、版面和樣式中保持顯著的一致性

與大多數圖像製作模型不同,Qwen-Image 可以無縫整合視覺設計和排版- 為重視創意自由和像素級精確度的內容創造者、設計師和藝術家創造了一個新的範例。

在 PicLumen,我們提供兩種模式:Qwen-Image用於高品質的生成(無需編輯),Qwen-Image-Edit用於生成和編輯。請選擇最適合您需求的模式。


重點介紹

  • 文字渲染精通- 以多種語言和樣式產生包含逼真、形狀正確文字的影像,並維持對齊、透視和材質的一致性。
  • 功能強大的編輯管道- 可透過文字指示或視覺參考編輯現有影像,同時保留結構、照明和身分。
  • 版面與構圖意識- 瞭解設計構圖,讓標題、字幕和物件等元素自然放置。
  • 身分識別與一致性- 跨世代維持主題、面孔、品牌標誌和其他鮮明特徵的一致性。
  • 美學上的彈性- 能夠製作跨越攝影、插圖、電影和平面設計風格的影像,並擁有豐富的光線和細膩的紋理。


1.文字轉影像產生 (Qwen-Image)

概述
Qwen-Image 接受純文字描述,並創造視覺構圖,將排版、佈局和風格融入圖像本身。

提示技巧

  • 指定文字應該出現的位置,並描述其視覺特質。
  • 結合文字細節與環境背景。
  • 包括素材和語調提示。
  • 提及設計概念,例如社論海報風格裝飾藝術美學

範例

AI 產生的香水廣告,玻璃瓶放在大理石基座上,金色襯線文字「Eau d'Élégance」,由 Qwen-Image 模型製作。

提示:高檔香水廣告,大理石基座上有一個帶金色瓶蓋的玻璃瓶,四周環繞著柔和的霧氣。上半部的大型優雅襯線體文字以金屬金色書寫「Eau d'Élégance」;下方的精細標語:「Essence of Timeless Beauty」以細緻的白色字體書寫。


2.圖片編輯 (Qwen-Image-Edit)

概述
Qwen-Image 的編輯模式可讓使用者透過描述性的指示來修改現有的影像 - 例如改變背景、改變材質、調整光線或加入文字,同時保留原始主題的完整性。

提示技巧

  • 明確說明保持不變的內容。
  • 精確描述修改。
  • 澄清情緒和語氣。
  • 包含位置提示,例如右上角居中對齊的標題覆蓋

範例

經 AI 編輯的黑色霧面耳機,水泥牆背景上有白色文字「Pure Sound」,產品照片由 Qwen-Image 增強 - 資料來源
經 AI 編輯的啞光黑色耳機,水泥牆背景上有白色文字「Pure Sound」,產品照片經 Qwen-Image -edited 增強。

提示:"保持產品相同,將背景換成由柔和側光照亮的質感混凝土牆,並在底部附近以細白襯線字體覆蓋短語'Pure Sound'"。

使用 AI 編輯的咖啡杯照片,加入金色文字「Morning Ritual」和明亮的廚房背景 - 原始碼
用 AI 編輯的咖啡杯照片,加入金色文字「Morning Ritual」和明亮的廚房背景 - 已編輯

提示:編輯木桌上的咖啡杯,保留其形狀與標誌。將背景換成明亮的廚房佈景,並在杯子上加入微妙的浮雕金色文字「Morning Ritual」

時尚肖像與海灘日落的合成 AI 圖像,太陽眼鏡上的暖色高光,由 Qwen-Image 製作 - 資料來源
時尚肖像與海灘日落的合成 AI 圖像,太陽眼鏡上的暖色高光由 Qwen-Image 製作 - 已編輯

提示:將圖中的男孩換成黑色長髮的動漫女孩,衣服和其他部分保持不變。

Qwen-Image 的多步驟編輯

提示 1:站立,一隻手放在臀部,另一隻手成 V 字型。

提示 2:用雙手塑造一個心形。

提示 3:雙手拿著寫有「歡迎來到 PicLumen」的小黑板。

提示 4:將攝影機拉近。


3.多影像編輯

概觀
Qwen-Image-Edit 支援結合多個影像輸入- 將主體和環境合併為一致的場景。

提示技巧

  • 描述每個影像的角色。
  • 定義它們應該如何合併。
  • 保持現實。
  • 加入風格方向,如電影光線編輯構圖

範例

時尚人像與海灘日落的合成 AI 圖像,太陽眼鏡上的暖色高光由 Qwen-Image 製作

提示:「圖 2 中的女性戴著太陽眼鏡在圖 1 中的躺椅上享受日光浴」。


4.樣式轉移和視圖轉換

概述
Qwen-Image 支援風格重新詮釋和視點轉換 - 將現有的視覺效果轉換為新的藝術或電影構成,同時保留結構的完整性。

提示技巧

  • 同時提及來源和目標樣式。
  • 定義新的攝影角度或觀點。
  • 包括燈光和音調提示。
  • 使用波普藝術海報手繪漫畫風格等藝術參考。

範例
 

AI 轉換將街頭肖像變成具有半色调紋理和大膽色彩的流行藝術海報 - 原始碼
將街頭肖像轉換為具有半色调紋理和大膽色彩的流行藝術海報 - 已編輯

提示:"將圖像轉換成 2D 動漫風格的海報,使用粗線條和大膽的色塊;保留姿勢和服裝細節。

提示:將圖像轉換成黑白單色鉛筆素描風格。


5.圖中文字編輯

概述
Qwen-Image-Edit 可以直接編輯和替換圖像中的文字 - 保留原始字體、位置和效果,例如陰影和金屬光澤。與其他機型相比,它的優勢在於能夠處理更複雜的文字,例如中文、日文和韓文。

提示技巧

  • 描述現有的文字樣式。
  • 指定要變更的內容。
  • 提及光澤或色調等細節。
  • 保持精確的佈局提示。

範例

AI 編輯的廣告牌,將「SUMMER SALE」改成「HOLIDAY LAUNCH」,同時保留字型和陰影 - 原始碼
經 AI 編輯的廣告牌,將「SUMMER SALE」改成「HOLIDAY LAUNCH」,同時保留字型和陰影 - 經編輯

提示:「將文字 」SUMMER SALE「 改為 」HOLIDAY LAUNCH「,同時保持字型、大小和陰影相同」。

Qwen-Image-Edit 也可以支援複雜的文字替換。

文字編輯範例 by Qwen-Image - 原始碼
文字編輯範例 by Qwen-Image - 已編輯

提示:將文字 "Summer life accessories「 改為 」夏日生活搭子"

複雜的文字渲染,由 Qwen-Image 提供

提示:三個動漫女孩手持三個標誌,分別寫著 「歡迎光临」、"ようこそ 「和 」환영합니다",各自帶著不同的臉部表情,站在咖啡館背景前。


6.進階控制

概述
現在到了我最喜歡的部分 - Qwen-Image-Edit 支援類似 SDXL 時代的 ControlNet 式調節。更棒的是,它同時原生支援三種強大的模式:OpenPoseDepthCanny

提示技巧

  • 準備您要用來控制的影像。(在 PicLumen 中,使用 影像參考 而不是 圖片控制,因為 Qwen 是直接由影像本身引導,而不是傳統的 ControlNet 管線)。
  • 清楚描述您想要達到的視覺結果或效果。

範例

開放姿勢編輯範例 by Qwen-Image - 原始碼
開放姿勢編輯範例 by Qwen-Image - open-pose iamge
Qwen-Image 的開放姿勢編輯範例 - 已編輯

提示:「圖 2 中的女孩改成圖 1 中的姿勢」


撰寫有效的提示

  1. 要描述,不要抽象。使用生動的細節。
  2. 指定材質和燈光。 霧面天鵝絨霓虹燈等詞彙有助於逼真度。
  3. 使用清楚的位置提示。
  4. 強調情感語調。
  5. 結合主題與風格。
  6. 迭代和改進。
  7. 平衡視覺與文字。
  8. 利用熟悉的藝術術語。

實用案例

品牌或活動視覺

由 Qwen-Image 製作的護膚產品照片,配以粉彩雲彩和銀色標題「Glow Within」。

提示:"柔和的雲層前有一個光滑的護膚品瓶子,標題文字'Glow Within'是纖細的銀色字體,恬靜的粉彩色調"。

產品展示與視覺行銷

反光地板上的白色運動鞋,搭配 AI 疊加文字「Step Ahead」,極簡產品展示

提示:"白色運動鞋放置在反光的黑色地板上,配以柔和的聚光燈,覆蓋文字'Step Ahead',使用纖細的無襯線字體"。

插圖或海報藝術

人物在未來式屋頂上的 AI 插圖海報,霓虹燈標題「NEXT ERA

提示:"圖中人物站在未來感十足的屋頂上,霓虹燈標題'NEXT ERA'在後面發光,漫畫式燈光"。


Qwen-Image Prompt Library

1.現代社論海報

女性穿著風衣的時尚社論 AI 海報,標題為「THE STYLE ISSUE」,副標題為「永恆的設計」。

"穿著米色風衣的女人在窗邊,標題'THE STYLE ISSUE「,副標題」Timeless Design'"。變化:身穿西裝的男子,黑白色調,標題'THE CLASS EDITION'"。

2.藝術概念插畫

雨夜路燈下女孩的動畫 AI 插畫

「雨夜街燈下的女孩,電影般的氛圍」。變化:霓虹燈下老爺車旁的男孩"。

3.產品展示

無線耳塞,霧面,帶邊燈和標題「Sonic Clarity」。

"黑色霧面的無線耳塞,柔和的邊緣燈,標題'Sonic Clarity'"

4.電影場景

AI 生成的人在霧中穿行的電影夜景,標題為「MIDNIGHT ECHO

"男人在夜晚穿過霧氣瀰漫的街道,倒影在濕漉漉的路面上,標題'MIDNIGHT ECHO'"。變體:紅色霓虹燈下汽車旁的女子,標題'AFTERGLOW'"。

5.生活方式與室內設計

簡約客廳,搭配白色沙發和木質家具,AI 效果圖,標題為「平靜空間

"有陽光、白色沙發和木質家具的極簡客廳,文字為「平靜空間」"

6.藝術肖像

畫家風格的柔和金光 AI 女性肖像

「極近距離的肖像,柔和的金色光線,金色的頭髮在臉前飄動,繪畫般的色調」。

7.復古平面海報

etro AI 摩托車海報,幾何設計,標題「SPEED & GRACE

"插圖摩托車海報,幾何圖形的紅色和米色,標題'SPEED & GRACE'"


使用提示的提示

  • 專注於材質、光線和色調,而非解析度。
  • 將視覺和文字元素結合在一起。
  • 使用具體、具體的細節。
  • 使用編輯模式精煉結果。
  • 保持各系列風格一致。

結論

Qwen-Image 將文字理解、視覺生成和精確編輯融合到一個系統中,無需後期編輯或外部工具即可實現專業品質的創意和設計工作流程。

此模型具有極高的潛力,但需要先進的提示製作技巧才能發揮其全部威力。Qwen-Image 的另一個顯著特點是,使用相同的提示,它可以在多個世代中產生相對一致的結果。因此,我們建議您每個提示只生成一張圖像,這樣可以幫助您節省流明和生成時間。

當產生的影像包含需要改進的細微邏輯問題或細節時,您可以執行多次挑選世代來微調結果。

Qwen 擁有 20B 的模型參數,提供極大的創作可能性 - 現在輪到您釋放想像力了。祝您提示愉快!

所有文章
Qwen-Image 模型卡

Qwen-Image 手冊

Qwen-Image:為美而生,為控制而生 Qwen-Image 是一個建立在 MMDiT 架構上的 200 億個參數的基礎模型,專為高保真圖像生成和精細的視覺編輯而設計。它能直接在圖像中渲染複雜的文字,執行精確的圖像編輯,並在不同的主題、版面和樣式中保持顯著的一致性。與大多數圖像製作模型不同,Qwen-Image 可以無縫整合視覺設計和排版 - 為重視內容創造者、設計師和藝術家創造了一個新的範例...
線上製作工作室品質的 ID 照片

專業證件肖像 - 線上製作工作室品質的證件照片

在專業和官方場合中,一張光潔的證件照片不僅是一項要求,更是可信度、值得信賴和注重細節的體現。然而,並不是每個人都能使用攝影棚或有時間反覆重拍。使用 PicLumen 的專業證件肖像工具,您可以立即產生乾淨、高品質的證件風格照片。其結果反映了攝影棚的標準:正式的服裝、乾淨的背景,以及專業的美感,適合履歷、求職申請......
使用自動上色讓您的線條藝術栩栩如生

自動上色 - 讓您的線條藝術立即栩栩如生

色彩賦予藝術活力與情感衝擊力。但手動為線稿上色可能很花時間,尤其是漫畫、插圖或快速的設計迭代。有了 PicLumen 的自動上色工具,您可以利用 AI 驅動的自動上色功能,立即為草圖或線稿注入生命力。節省數小時的手動工作,同時保持您的創意流程不受干擾。自動上色為何重要 上色是每位藝術家工作流程中的重要步驟:加快製作速度...
將您的草稿提煉為乾淨、細緻的線條藝術

將您的草稿提煉為乾淨、細緻的線條藝術

在創作插畫、漫畫或概念藝術時,藝術家通常會從粗略的草稿或草圖開始。雖然這些草稿能捕捉到構思的精髓,但卻可能缺乏清晰度和細節。使用 PicLumen 的精修工具,您可以立即將粗略的線稿轉換為乾淨、細緻的線條藝術 - 順暢的輪廓、增強的細節和專業品質的結果,以便上色或出版。為什麼線條藝術精細化很重要 線條藝術是數位插畫的基礎....。
介紹 PicLumen 的姿勢控制功能

介紹 PicLumen 的姿勢控制功能

什麼是姿勢控制?Pose Control 是 PicLumen 的一項新功能,可讓您自訂 AI 產生影像中人物的姿勢。有時候,您心目中有一個非常特定的姿勢,這項功能可確保您所產生的角色準確地遵循該姿勢,因此您可以完全達到您想要的造型。*在這張圖片中,我們使用 Pony Diffusion V6 來展示姿勢控制。為什麼要使用姿勢控制?微調結果:獲得精確的...
粉黛

如何在線上銷售 AI 藝術品:讓您的 AI 創作賺錢的簡單步驟

AI 產生的藝術為藝術家、創作者,甚至是初學者開啟了令人興奮的機會,讓他們可以將自己的創作賺錢。無論您是數位藝術家或只是在探索 AI 工具,銷售 AI 藝術品都是分享您的創作並賺取收入的好方法。本指南將教您如何在線上創作、優化和銷售 AI 生成的藝術作品,無需任何成本和網站。什麼是 AI 藝術?

從文字提示創造圖片的最佳 AI 藝術生成器

隨著 AI 美工生成器不斷演進,新產品也進入這個領域,尋找優質工具變得越來越複雜,在短短兩三年間,文字轉影像的 AI 美工生成器已成為普遍現象。成熟的 AI 美術工具逐漸受到重視,而載有進階功能的新應用程式也進入市場。選擇高品質的工具越來越具有挑戰性,幾乎就像大海撈針一樣。
20 個最佳 DnD 提示橫幅

20 個最佳 DnD 提示,創造令人驚豔的 DnD AI 藝術

Dungeons & Dragons (DnD) 是一個充滿無限創意的領域,玩家透過想像力為英雄、惡棍和世界注入生命。如果您能以視覺化的方式將這些想法實現呢?隨著 DnD AI 圖像創造器的興起,製作令人驚艷的 DnD 角色、令人屏息的風景和史詩般的戰鬥場景變得前所未有的簡單。無論您是在探索 DnD 角色提示或 DnD 繪圖提示,PicLumen 的 DnD AI 圖片產生器都能讓您...