Qwen-Image: 아름다움을 위해 제작, 제어를 위해 구축

Qwen-Image는 고충실도 이미지 생성 및 세밀한 시각적 편집을 위해 설계된 MMDiT 아키텍처에 기반한 200억 개의 파라미터로 구성된 기초 모델입니다. 이미지 내에서 복잡한 텍스트를 직접 렌더링하고 정밀한 이미지 편집을 수행하며 주제, 레이아웃 및 스타일 전반에 걸쳐 뛰어난 일관성을 유지하는 기능이 돋보입니다.
대부분의 이미지 생성 모델과 달리 Qwen-Image는 시각 디자인과 타이포그래피를 원활하게 통합할 수 있어 창작의 자유와 픽셀 수준의 정밀도를 모두 중시하는 콘텐츠 제작자, 디자이너 및 아티스트에게 새로운 패러다임을 제시합니다.
PicLumen에서는 두 가지 모델을 제공합니다: 고품질 생성(편집 없음)을 위한 Qwen-Image와 생성 및 편집을 모두 위한 Qwen-Image-Edit입니다. 요구 사항에 가장 적합한 모델을 선택하세요.
주요 특징
- 텍스트 렌더링 숙달 - 다양한 언어와 스타일로 사실적이고 정확한 모양의 텍스트를 포함하는 이미지를 생성하여 정렬, 원근감 및 소재의 일관성을 유지합니다.
- 강력한 편집 파이프라인 - 구조, 조명, 정체성을 유지하면서 텍스트 지침이나 시각적 참조를 통해 기존 이미지를 편집할 수 있습니다.
- 레이아웃 및 구도 인식 - 디자인 구도를 이해하여 제목, 자막, 개체와 같은 요소를 자연스럽게 배치할 수 있습니다.
- 정체성 및 일관성 - 여러 세대에 걸쳐 주제, 얼굴, 브랜드 로고 및 기타 고유한 특징의 일관성을 유지합니다.
- 미적 유연성 - 풍부한 조명과 디테일한 텍스처로 사진, 일러스트레이션, 시네마틱, 그래픽 디자인 스타일 전반에 걸친 이미지를 제작할 수 있습니다.
1. 텍스트-이미지 생성(Qwen-이미지)
개요
Qwen-Image는 순수한 텍스트 설명을 받아들이고 이미지 자체의 일부로 타이포그래피, 레이아웃 및 스타일을 통합하는 시각적 구성을 만듭니다.
프롬프트 팁
- 텍스트가 표시될 위치를 지정하고 시각적 특성을 설명합니다.
- 텍스트 세부 정보를 환경 컨텍스트와 결합합니다.
- 소재 및 톤 힌트를 포함하세요.
- 편집용 포스터 스타일이나 아르데코 미학과 같은 디자인 컨셉을 언급하세요.
예

프롬프트: 대리석 받침대 위에 황금색 뚜껑이 달린 유리병이 부드러운 안개로 둘러싸인 고급 향수 광고입니다. 상단에는 메탈릭 골드 컬러의 우아한 세리프체로 '오 드 엘레강스 '라고 적혀 있고, 그 아래에는 고급스러운 흰색 글자로 '영원한 아름다움의 본질' 이라는 은은한 태그 라인이 있습니다.
2. 이미지 편집(Qwen-Image-Edit)
개요
Qwen-Image의 편집 모드를 사용하면 배경 변경, 재질 변경, 조명 조정, 텍스트 추가 등 설명을 통해 기존 이미지를 수정하면서 원본 피사체의 무결성을 유지하면서 수정할 수 있습니다.
프롬프트 팁
- 변경하지 않고 유지할 항목을 명시적으로 설명하세요.
- 수정 사항을 정확하게 설명하세요.
- 분위기와 어조를 명확히 하세요.
- 오른쪽 상단 모서리 또는 중앙 정렬 제목 오버레이와 같은 위치 힌트를 포함하세요.
예제


프롬프트: "제품을 동일하게 유지하고 배경을 부드러운 측면 조명이 비추는 질감이 있는 콘크리트 벽으로 바꾸고 하단 근처에 얇은 흰색 세리프 글꼴로 'Pure Sound' 라는 문구를 오버레이하세요."


프롬프트: 커피잔의 모양과 로고를 유지하면서 나무 테이블 위에 커피잔을 편집합니다. 배경을 밝은 주방 설정으로 바꾸고 머그잔에 은은한 금색 엠보싱 텍스트 'Morning Ritual' 을 추가합니다.


프롬프트: 그림의 소년을 긴 검은 머리카락을 가진 애니메이션 소녀로 바꾸고 옷과 다른 부분은 그대로 유지합니다.

프롬프트 1: 한 손은 엉덩이에 대고 다른 한 손은 브이자를 그리며 서 있습니다.
프롬프트 2: 양손으로 하트 모양을 만듭니다.
프롬프트 3: 양손으로 "PicLumen에 오신 것을 환영합니다"라고 쓰인 작은 칠판을 들고 있습니다.
프롬프트 4: 카메라를 가까이 가져옵니다.
3. 다중 이미지 편집
개요
여러 이미지 입력을 결합하여 피사체와 환경을 일관된 장면으로 병합하는 Qwen-Image-Edit을 지원합니다.
프롬프트 팁
- 각 이미지의 역할을 설명합니다.
- 병합 방법을 정의합니다.
- 사실감을 유지합니다.
- 시네마틱 조명이나 편집 구성과 같은 스타일 연출을 추가하세요.
예

프롬프트: "그림 2의 여성은 선글라스를 쓴 채 그림 1의 갑판 의자에서 일광욕을 하고 있습니다."
4. 스타일 전송 및 보기 변환
개요
Qwen-Image는 스타일 재해석 및 시점 변환을 지원하여 구조적 무결성을 유지하면서 기존 비주얼을 새로운 예술적 또는 영화적 구성으로 전환할 수 있습니다.
프롬프트 팁
- 소스 스타일과 대상 스타일을 모두 언급합니다.
- 새 카메라 각도 또는 시점을 정의합니다.
- 조명 및 톤 단서를 포함하세요.
- 팝아트 포스터나 손으로 그린 만화 스타일과 같은 예술적 레퍼런스를 활용하세요.
예


프롬프트: "이미지를 두꺼운 윤곽선과 대담한 색상 블록을 사용하여 2D 애니메이션 스타일의 포스터로 변환하고 포즈와 의상 디테일을 유지하세요."


프롬프트: 이미지를 흑백 흑백 연필 스케치 스타일로 변환합니다.
5. 이미지 내 텍스트 편집
개요
Qwen-Image-Edit는 원본 글꼴, 배치, 그림자 및 금속 광택과 같은 효과를 그대로 유지하면서 이미지 내부의 텍스트를 직접 편집하고 바꿀 수 있습니다. 다른 모델에 비해 중국어, 일본어, 한국어와 같은 복잡한 텍스트를 처리할 수 있다는 점이 장점입니다.
프롬프트 팁
- 기존 텍스트 스타일을 설명합니다.
- 변경할 내용을 지정합니다.
- 글로우 또는 색상 톤과 같은 세부 사항을 언급합니다.
- 레이아웃 단서를 정확하게 유지하세요.
예


프롬프트: "글꼴, 크기 및 그림자를 동일하게 유지하면서 "SUMMER SALE" 텍스트를 "HOLIDAY LAUNCH"로 변경합니다."
Qwen-Image-Edit는 복잡한 텍스트 교체도 지원할 수 있습니다.


프롬프트: "여름 생활 액세서리"라는 텍스트를 "夏日生活搭子"로 변경합니다.

프롬프트: "欢迎光临", "ようこそ", "환영합니다"라고 적힌 팻말을 각각 다른 표정으로 들고 있는 세 명의 애니메이션 소녀가 카페 배경 앞에 서 있는 모습입니다.
6. 고급 제어
개요
이제 제가 가장 좋아하는 부분에 도달했습니다. Qwen-Image-Edit는 SDXL 시대와 유사한 ControlNet 스타일의 컨디셔닝을 지원합니다. 더 좋은 점은 기본적으로 세 가지 강력한 모드를 한 번에 지원한다는 점입니다: 오픈포즈, 뎁스, 캐니입니다.
프롬프트 팁
- 제어에 사용할 이미지를 준비합니다. (PicLumen에서는 이미지 참조 대신 이미지 제어대신 이미지 참조를 사용해야 합니다. Qwen은 기존 ControlNet 파이프라인이 아닌 이미지 자체에 의해 직접 안내되기 때문입니다).
- 달성하려는 시각적 결과 또는 효과를 명확하게 설명하세요.
예



프롬프트: "그림 2의 소녀가 그림 1의 포즈로 변경되었습니다."
효과적인 프롬프트 제작
- 추상적이지 않고 서술적으로 작성하세요. 생생한 세부 정보를 사용하세요.
- 재질과 조명을 지정합니다. 무광택, 벨벳, 네온 글로우와 같은 용어는 사실감을 더합니다.
- 명확한 위치 단서를 사용하세요.
- 감정적인 어조를 강조합니다.
- 주제와 스타일을 결합합니다.
- 반복하고 다듬습니다.
- 비주얼과 텍스트의 균형을 맞추세요.
- 익숙한 미술 용어를 활용하세요.
실제 사용 사례
브랜드 또는 캠페인 비주얼

프롬프트: "부드러운 구름 앞의 세련된 스킨케어 제품 병, 얇은 은색 글자로 된 제목 텍스트 'Glow Within', 차분한 파스텔 톤."
제품 쇼케이스 및 비주얼 머천다이징

프롬프트: "반사되는 검은색 바닥에 흰색 운동화를 은은한 스포트라이트와 함께 배치하고 슬림한 산세리프체로 'Step Ahead ' 텍스트를 오버레이합니다."
일러스트레이션 또는 포스터 아트

프롬프트: "미래적인 옥상에 서 있는 일러스트 캐릭터, 뒤에서 빛나는 네온 타이틀 'NEXT ERA', 코믹한 조명."
Qwen-이미지 프롬프트 라이브러리
1. 모던 에디토리얼 포스터

"창가에 베이지색 트렌치코트를 입은 여성, 제목 'THE STYLE ISSUE', 부제 '타임리스 디자인'." 변형: "정장 차림의 남성, 흑백 톤, 제목 'THE CLASS EDITION'."
2. 예술적 컨셉 일러스트레이션

"비 오는 밤 가로등 아래 소녀, 영화 같은 분위기." 변형: "네온 불빛 아래 빈티지 자동차 옆의 소년."
3. 제품 쇼케이스

"무광 블랙 표면의 무선 이어버드, 부드러운 테두리 조명, '소닉 클래러티'라는 타이틀."
4. 시네마틱 장면

"밤에 안개가 자욱한 거리를 걷는 남자, 젖은 도로에 비친 반사, 제목 'MIDNIGHT ECHO'." 변형: "붉은 네온 불빛 아래 자동차 옆의 여자, 제목 'AFTERGLOW'."
5. 라이프스타일 & 인테리어 디자인

"햇빛이 들어오는 미니멀한 거실, 흰색 소파와 원목 가구, '차분한 공간'이라는 텍스트."
6. 예술적 초상화

"부드러운 황금빛 조명과 함께 극단적인 클로즈업 초상화, 금발 머리가 얼굴 앞에서 펄럭이며 회화적인 톤으로 표현되었습니다."
7. 빈티지 그래픽 포스터

"일러스트 오토바이 포스터, 기하학적인 빨간색과 베이지색 모양, 제목 'SPEED & GRACE'."
프롬프트 사용 팁
- 해상도보다는 소재, 조명, 톤에 집중하세요.
- 시각적 요소와 텍스트 요소를 함께 결합합니다.
- 구체적이고 구체적인 세부 정보를 사용하세요.
- 편집 모드를 사용하여 결과를 구체화합니다.
- 시리즈 전반에 걸쳐 일관된 스타일을 유지하세요.
결론
Qwen-Image는 텍스트 이해, 시각적 생성, 정밀한 편집 기능을 하나의 시스템에 통합하여 사후 편집이나 외부 도구 없이도 전문가 수준의 크리에이티브 및 디자인 워크플로우를 지원합니다.
이 모델은 잠재력이 매우 높지만, 그 잠재력을 최대한 발휘하려면 고급 프롬프트 제작 기술이 필요합니다. 퀀 이미지의 또 다른 주목할 만한 특징은 동일한 프롬프트를 사용하여 여러 세대에 걸쳐 비교적 일관된 결과를 생성한다는 것입니다. 따라서 프롬프트당 하나의 이미지만생성하는 것이 루멘과 생성 시간을 모두 절약하는 데 도움이 됩니다.
생성된 이미지에 사소한 논리적 문제나 수정이 필요한 세부 사항이 포함된 경우, 여러 번의 체리픽 생성을 수행하여 결과를 미세 조정할 수 있습니다.
20억 개의 모델 파라미터를 지원하는 Qwen은 무한한 창의적 가능성을 제공합니다. 이제 여러분이 상상력을 발휘할 차례입니다. 즐거운 도전이 되길 바랍니다!