クウェン画像ハンドブック

クウェン・イメージ美しさのために作られ、コントロールのために作られる

qwenモデルカード

Qwen-Imageは、MMDiTアーキテクチャ上に構築された200億パラメータの基盤モデルで、忠実度の高い画像生成ときめ細かなビジュアル編集のために設計されています。画像内の複雑なテキストを直接レンダリングし、精密な画像編集を実行し、被写体、レイアウト、スタイル間で顕著な一貫性を維持する能力で際立っています。

一般的な画像生成モデルとは異なり、Qwen-Imageはビジュアルデザインとタイポグラフィをシームレスに統合することができ、クリエイティブな自由とピクセルレベルの精度の両方を重視するコンテンツクリエイター、デザイナー、アーティストに新しいパラダイムを生み出します。

PicLumenでは、2つのモデルを提供しています:Qwen-Imageは高品質な生成(編集なし)、Qwen-Image-Editは生成と編集の両方が可能です。お客様のご要望に合わせてお選びください。


主なハイライト

  • テキストレンダリングの達人- 複数の言語とスタイルで、アライメント、パース、マテリアルの一貫性を維持しながら、リアルで正しい形状のテキストを含むイメージを生成します。
  • 強力な編集パイプライン- 構造、照明、アイデンティティを保持しながら、テキスト指示やビジュアル参照によって既存の画像を編集できます。
  • レイアウトと構図の認識- デザイン構図を理解し、タイトル、サブタイトル、オブジェクトなどの要素を自然に配置できる。
  • アイデンティティと一貫性- 複数の世代にわたって、被写体、顔、ブランドロゴ、その他の特徴的な機能の一貫性を維持する。
  • 美的柔軟性- 豊かなライティングと詳細なテクスチャで、写真、イラストレーション、映画、グラフィックデザインなど、さまざまなスタイルのイメージを制作できます。


1.テキストから画像への変換(Qwen-Image)

概要
Qwen-Imageは、純粋にテキストによる説明を受け付け、タイポグラフィ、レイアウト、スタイルを画像そのものの一部として取り入れた視覚的なコンポジションを作成する。

プロンプティングのヒント

  • テキストを表示する場所を指定し、その視覚的性質を説明する。
  • テキストの詳細と環境的背景を組み合わせる。
  • 素材とトーンのヒントを含める。
  • エディトリアル・ポスター・スタイルや アール・デコ調の美学といったデザイン・コンセプトについて言及する。

大理石の台座に置かれたガラス瓶、金色のセリフ文字「Eau d'Élégance」のAI生成香水広告。

プロンプト大理石の台座の上に金色のキャップのついたガラス瓶が置かれ、柔らかな霧に包まれている高級香水の広告。上半分のエレガントなセリフ体の大きなテキストはメタリックゴールドで「Eau d'Élégance」、その下の繊細なキャッチコピーは細い白文字で「Essence of Timeless Beauty」


2.画像編集 (Qwen-Image-Edit)

概要
Qwen-Imageの編集モードでは、背景の変更、素材の変更、照明の調整、テキストの追加など、元の被写体の完全性を保ちながら、説明的な指示によって既存の画像を修正することができます。

プロンプティングのヒント

  • 何を変更しないかを明示する。
  • 修正内容を正確に説明してください。
  • ムードとトーンを明確にする。
  • 右上隅や 中央揃えのタイトルオーバーレイなど、位置のヒントを含める。

コンクリート壁の背景にAIで編集されたマットな黒のヘッドホン、白いテキスト「Pure Sound」、Qwen-Imageによる製品写真のエンハンスド - ソースはこちら
コンクリート壁面背景のマットな黒のヘッドフォン、白いテキスト「Pure Sound」、Qwen-Imageによって強調された製品写真。

プロンプト"製品はそのままで、背景を柔らかいサイドライトに照らされた質感のあるコンクリートの壁に置き換え、下部付近に細い白いセリフ体のフォントで「Pure Sound」というフレーズをオーバーレイしてください。"

コーヒーマグの写真をAIで編集し、金色のテキスト「Morning Ritual」と明るいキッチンの背景を追加 - source
コーヒーマグの写真をAIで編集し、金色のテキスト「Morning Ritual」と明るいキッチンの背景を追加 - 編集済み

プロンプト木製のテーブルの上に置かれたコーヒーマグを、その形とロゴはそのままに編集してください。背景を明るいキッチンのセッティングに置き換え、マグカップに「Morning Ritual」というゴールドのテキストをさりげなくエンボス加工してください。

ファッションポートレートとビーチの夕日、サングラスの暖かいハイライトを合成したAI画像:Qwen-Image - source
ファッションポートレートとビーチの夕日、サングラスの暖かいハイライトを合成したAI画像: Qwen-Image - 編集

プロンプト服装などは変えずに、写真の男の子を黒髪ロングのアニメの女の子に置き換えてください。

多段階編集 by Qwen-Image

プロンプト1:片方の手を腰に当て、もう片方の手でVサインを作って立つ。

プロンプト2両手でハートの形を作る。

プロンプト3:「PicLumenへようこそ」と書かれた小さな黒板を両手で持つ。

プロンプト4:カメラを近づける。


3.複数画像の編集

概要
Qwen-Image-Editは、複数の画像入力を組み合わせて、被写体や環境を首尾一貫したシーンに統合することをサポートしています。

プロンプティングのヒント

  • それぞれのイメージの役割を説明してください。
  • どのように合併すべきかを定義する。
  • 現実主義を維持する。
  • 映画的な光や 編集的な構図など、スタイリスティックな演出を加える。

ファッションポートレートとビーチの夕日を合成したAI画像。

プロンプト「図2の女性は、図1のデッキチェアの上でサングラスをかけて日光浴をしている。


4.スタイル転送とビューの変換

概要
Qwen-Imageは、スタイルの再解釈と視点の変換をサポートします。つまり、構造的な完全性を維持しながら、既存のビジュアルを新しい芸術的または映画的なコンポジションに変換します。

プロンプティングのヒント

  • ソースとターゲットの両方のスタイルに言及する。
  • 新しいカメラアングルまたは視点を定義します。
  • 照明とトーンの合図を入れる。
  • ポップアートのポスターや 手描きのコミックスタイルなど、芸術的なものを参考にする。


 

ストリートのポートレートを、ハーフトーンのテクスチャと大胆な色使いでポップアートのポスターに変えるAI変換 - source
ストリートのポートレートをハーフトーンのテクスチャと大胆な色彩でポップアートのポスターに変えるAI変換 - 編集済み

プロンプト「太い輪郭線と大胆な色使いで、2Dアニメスタイルのポスターに変身させてください。

プロンプトイメージを白黒の鉛筆スケッチ風に変換してください。


5.テキスト・イン・イメージ編集

概要
Qwen-Image-Editは、画像内のテキストを直接編集・置換することができ、元のフォント、配置、影やメタリックな輝きなどの効果を保持します。中国語、日本語、韓国語など、より複雑なテキストを扱えることが、他のモデルにはない利点です。

プロンプティングのヒント

  • 既存のテキストスタイルを記述する。
  • 何を変更するかを指定する。
  • 輝きや色調のような洗練について言及する。
  • レイアウトの合図は正確に。

SUMMER SALE」を「HOLIDAY LAUNCH」に置き換え、フォントとシャドウを維持したAI編集のビルボード - ソースはこちら
SUMMER SALE」を「HOLIDAY LAUNCH」に置き換え、フォントとシャドウを維持したAI編集のビルボード - 編集済み

プロンプト「フォント、サイズ、シャドウを同じにしたまま、"SUMMER SALE "というテキストを "HOLIDAY LAUNCH "に変更してください。

Qwen-Image-Editは複雑なテキスト置換にも対応しています。

テキスト編集の例 by Qwen-Image - source
テキスト編集の例 by Qwen-Image - 編集済み

プロンプト文章 "Summer life accessories" を "夏日生活搭子" に改める。

Qwen-Imageによる複雑なテキストレンダリング

プロンプト欢迎光临"、"ようこそ"、"환영합니다 "と書かれた3つの看板を持った3人のアニメの女の子が、それぞれ違う表情でカフェの背景の前に立っている。


6.高度な制御


Qwen-Image-Edit は、SDXL 時代と同様の ControlNet スタイルのコンディショニングをサポートしています。さらに良いことに、ネイティブで3つの強力なモードを同時にサポートしています:OpenPoseDepthCannyです。

プロンプティングのヒント

  • コントロールに使いたい画像を用意する。(PicLumenでは 画像参照 の代わりに 画像制御Qwenは従来のControlNetパイプラインではなく、画像そのものに直接導かれるからです)。
  • 達成したい視覚的な結果や効果を明確に説明する。

オープンポーズの編集例 by Qwen-Image - source
オープンポーズ編集の例 by Qwen-Image - オープンポーズ iamge
オープンポーズの編集例 by Qwen-Image - 編集済み

プロンプト「図2の女の子を図1のポーズに変える。


効果的なプロンプトを作る

  1. 抽象的ではなく、描写的に。生き生きとしたディテールを使うこと。
  2. 素材と照明を指定する。 マットベルベットネオンの輝きなどの用語は、リアリズムを助ける。
  3. 明確な位置の合図を使う。
  4. 感情的なトーンを強調する。
  5. 主題とスタイルを組み合わせる。
  6. 繰り返し、洗練させる。
  7. ビジュアルとテキストのバランスをとる。
  8. 身近な美術用語を活用する。

実用的な使用例

ブランドまたはキャンペーンのビジュアル

パステルカラーの雲とシルバーのタイトル「Glow Within」をあしらったスキンケア製品の写真。

プロンプト"柔らかな雲の前にある洗練されたスキンケア製品のボトル、細いシルバーの文字で書かれたタイトルテキスト「Glow Within」、落ち着いたパステルトーン。"

製品ショーケースとビジュアル・マーチャンダイジング

反射フロアに白いスニーカー、AIが追加されたオーバーレイテキスト「Step Ahead」、ミニマルな製品ショーケース

プロンプト"白いスニーカーをスポットライトの当たる黒い床の上に置き、スリムなサンセリフ体で「Step Ahead」というテキストを重ねる。"

イラスト・ポスター

ネオンのタイトル「NEXT ERA」と近未来的な屋上にいるキャラクターのイラスト入りAIポスター

プロンプト"近未来的な屋上に立つイラストのキャラクター、後ろに光るネオンのタイトル「NEXT ERA」、コミカルな照明"


Qwen-画像プロンプトライブラリ

1.モダンなエディトリアルポスター

THE STYLE ISSUE」と題されたトレンチコートを着た女性のファッション・エディトリアルAIポスター。

"ベージュのトレンチコートを着た窓際の女性、タイトル「THE STYLE ISSUE」、サブタイトル「Timeless Design」。"バリエーション:スーツ姿の男性、モノクロ調、タイトル「THE CLASS EDITION」。"

2.アーティスティック・コンセプト・イラストレーション

雨の夜、街灯の下にいる少女のシネマティックAIイラストレーション

"雨の夜の街灯の下の少女、映画のような雰囲気"バリエーション:ネオンの下でヴィンテージカーの横にいる少年。"

3.製品ショーケース

マットな表面にリムライトとタイトル「Sonic Clarity」のワイヤレスイヤホン

"マットブラックの表面にワイヤレスイヤホン、ソフトリムライト、タイトル「Sonic Clarity」"

4.映画的シーン

MIDNIGHT ECHO」というタイトルで、霧の中を歩く男のAIが生成した映画のような夜景。

"霧の夜道を歩く男、濡れた道に映る反射、タイトル「MIDNIGHT ECHO」"バリエーション:赤いネオンの下、車の近くにいる女性

5.ライフスタイル&インテリアデザイン

白いソファと木製家具のあるミニマルなリビングルーム、AIレンダリング「Calm Spaces

"日差しが差し込むミニマルなリビングルーム、白いソファと木製家具、テキスト「Calm Spaces」"

6.芸術的ポートレート

絵画的なスタイルで描かれた、柔らかな金色の光を放つ女性のAIポートレート

「柔らかな金色の光に照らされた極端なクローズアップのポートレート、顔の前でなびくブロンドの髪、絵画的なトーン。

7.ヴィンテージ・グラフィック・ポスター

幾何学的なデザインとタイトル「SPEED & GRACE」のエトロAIモーターサイクル・ポスター

"幾何学的な赤とベージュの図形、タイトル「SPEED & GRACE」、バイクのイラスト入りポスター"


プロンプトを使うヒント

  • 解像度よりも素材、照明、トーンに重点を置く。
  • ビジュアル要素とテキスト要素を組み合わせる。
  • 具体的で具体的な詳細を使用する。
  • 編集モードを使用して結果を絞り込む。
  • シリーズ間でスタイルを一貫させる。

まとめ

Qwen-Imageは、テキスト理解、ビジュアル生成、正確な編集を1つのシステムに統合し、ポスト編集や外部ツールなしでプロ品質のクリエイティブおよびデザインワークフローを実現します。

このモデルは非常に高いポテンシャルを持っているが、その力を最大限に引き出すには高度なプロンプト作成のスキルが必要である。Qwen-Imageのもう1つの特筆すべき特徴は、同じプロンプトを使用して複数の世代を作成しても、比較的一貫した結果が得られることです。そのため、1つのプロンプトにつき1つの画像を生成することをお勧めします。

生成された画像に細かい論理的な問題や詳細が含まれている場合は、何度かチェリーピック世代を実行して、結果を微調整することができます。

Qwenは20Bのモデルパラメータを持ち、膨大なクリエイティブの可能性を提供します。さあ、あなたの想像力を解き放つ番です!

すべての記事
クウェン-イメージ・モデル・カード

クウェン画像ハンドブック

Qwen-Image:美しさのために作られ、コントロールのために構築された Qwen-Imageは、MMDiTアーキテクチャ上に構築された200億パラメータの基礎モデルで、忠実度の高い画像生成ときめ細かなビジュアル編集のために設計されています。画像内に複雑なテキストを直接レンダリングし、精密な画像編集を行い、被写体、レイアウト、スタイルにかかわらず一貫性を維持できる点が特徴です。一般的な画像生成モデルとは異なり、Qwen-Imageはビジュアルデザインとタイポグラフィをシームレスに統合することができます。
スタジオ品質の証明写真をオンラインで作成

プロフェッショナルなIDポートレート - スタジオ品質のID写真をオンラインで作成

プロフェッショナルでオフィシャルな場面では、洗練された証明写真は単なる必要条件ではありません。しかし、誰もがスタジオを利用できるわけではありませんし、何度も撮り直す時間もありません。PicLumenのプロフェッショナルIDポートレートツールを使えば、クリーンで高品質なIDスタイルの写真を即座に作成できます。正装、きれいな背景、履歴書や求人の応募に適したプロフェッショナルな美しさなど、スタジオの標準を反映した仕上がりになります。
オートカラーリングで線画に命を吹き込む

オートカラーリング - 線画に即座に生命を吹き込む

色彩は、アートに躍動感と感情的なインパクトを与えるものです。しかし、手作業で線画に着色するのは、特に漫画やイラスト、素早くデザインを繰り返す場合、時間がかかることがあります。PicLumenの自動着色ツールを使えば、AIによる自動着色でスケッチや線画に即座に命を吹き込むことができます。クリエイティブな作業を中断することなく、手作業の時間を節約できます。自動カラーリングが重要な理由 カラーリングは、すべてのアーティストのワークフローにおいて重要なステップです:制作のスピードアップ
下書きをきれいで詳細な線画に仕上げる

下書きをきれいで詳細な線画に仕上げる

イラストやコミック、コンセプト・アートに取り組むとき、アーティストはラフ・ドラフトやスケッチから始めることが多い。これらの下書きはアイデアの本質を捉えていますが、明確さや洗練さに欠けることがあります。PicLumenのリファインツールを使えば、スケッチ風の線画を瞬時にクリーンで詳細な線画に変換することができます。線画のリファインが重要な理由 線画はデジタルイラストレーションの基礎です。
PicLumenのポーズコントロール機能のご紹介

PicLumenのポーズコントロール機能のご紹介

ポーズコントロールとは?ポーズコントロールはPicLumenの新機能で、AI生成画像の人物のポーズをカスタマイズすることができます。この機能によって、生成されたキャラクターがそのポーズに正確に従うようになり、思い通りのルックを実現することができます。*この画像では、Pony Diffusion V6を使用してポーズコントロールのデモを行っています。ポーズコントロールを使う理由微調整された結果:正確なポーズ...
ピンクの髪のファンタジー・キャラクター

AIアートをオンラインで販売する方法:あなたのAI作品を収益化する簡単なステップ

AIによって生成されたアートは、アーティストやクリエイター、そして初心者にも、創造性を収益化するエキサイティングな機会をもたらしました。あなたがデジタルアーティストであろうと、AIツールを探求しているだけであろうと、AIアートを販売することは、あなたの作品を共有し、収入を得るためのやりがいのある方法です。このガイドでは、AIアートを作成、最適化し、オンラインで販売するまでのプロセスを説明します。AIアートとは?

テキストプロンプトから画像を作成する最高のAIアートジェネレーター

AIアートジェネレーターが進化を続け、新しい製品がこの分野に参入するにつれ、質の高いツールを見つけるのはより複雑になってきており、わずか2〜3年の間に、テキストから画像へのAIアートジェネレーターは一般的な現象になりました。定評のあるAIアートツールが人気を集め、高度な機能を満載した新しいアプリが市場に参入している。高品質なツールを選ぶことはますます難しくなっており、まるで針の穴を探すようだ。
20ベストDnDプロンプトバナー

素晴らしいDnDのAIアートを作成するための20ベストDnDプロンプト

ダンジョンズ&ドラゴンズ(DnD)は、プレイヤーが想像力を駆使してヒーローや悪役、世界に命を吹き込む無限の創造性の領域です。そのアイデアに視覚的に命を吹き込むことができたらどうでしょう?DnD AIイメージクリエイターの台頭により、魅力的なDnDキャラクター、息をのむような風景、壮大なバトルシーンの作成がかつてないほど簡単になりました。PicLumenのDnD AIアートジェネレーターを使えば、DnDキャラクターのプロンプトやDnDドローイングのプロンプトのどちらを探しても、DnDキャラクターや風景、壮大な戦闘シーンを簡単に作成することができます。