Qwen-Imagen: Creado para la belleza, construido para el control

Qwen-Image es un modelo básico de 20.000 millones de parámetros basado en la arquitectura MMDiT, diseñado para generar imágenes de alta fidelidad y realizar ediciones visuales precisas. Destaca por su capacidad para renderizar texto complejo directamente dentro de las imágenes, realizar una edición precisa de las mismas y mantener una notable coherencia entre temas, diseños y estilos.
A diferencia de la mayoría de los modelos de generación de imágenes, Qwen-Image puede integrar a la perfección el diseño visual y la tipografía, creando un nuevo paradigma para los creadores de contenidos, diseñadores y artistas que valoran tanto la libertad creativa como la precisión a nivel de píxel.
En PicLumen, ofrecemos dos modelos: Qwen-Image para generación de alta calidad (sin edición) y Qwen-Image-Edit para generación y edición. Elija el modelo que mejor se adapte a sus necesidades.
Aspectos más destacados
- Dominio del renderizado de texto: genere imágenes que incluyan texto realista y con la forma correcta en varios idiomas y estilos, manteniendo la alineación, la perspectiva y la coherencia de los materiales.
- Potente proceso de edición: edite imágenes existentes mediante instrucciones de texto o referencias visuales, conservando la estructura, la iluminación y la identidad.
- Conocimiento del diseño y la composición - Comprende la composición del diseño, lo que permite la colocación natural de elementos como títulos, subtítulos y objetos.
- Identidad y coherencia - Mantiene la coherencia en los temas, rostros, logotipos de marca y otros rasgos distintivos a lo largo de varias generaciones.
- Flexibilidad estética: capaz de producir imágenes de estilos fotográficos, ilustrativos, cinematográficos y de diseño gráfico con una iluminación rica y texturas detalladas.
1. Generación de texto a imagen (Qwen-Image)
Resumen
Qwen-Image acepta descripciones puramente textuales y crea composiciones visuales que incorporan la tipografía, el diseño y el estilo como parte de la propia imagen.
Sugerencias
- Especifique dónde debe aparecer el texto y describa sus cualidades visuales.
- Combinar los detalles del texto con el contexto medioambiental.
- Incluya pistas sobre el material y el tono.
- Menciona conceptos de diseño como el estilo de cartel editorial o la estética art-deco.
Ejemplo

Sugerencia: Un anuncio de perfume de alta gama con un frasco de cristal con tapón dorado sobre un pedestal de mármol, rodeado de una suave bruma. En la parte superior, un elegante texto en serifa reza "Eau d'Élégance" en dorado metálico; debajo, un sutil eslogan: "Essence of Timeless Beauty" en letras blancas.
2. Edición de imágenes (Qwen-Image-Edit)
Visión general
El modo de edición de Qwen-Image permite a los usuarios modificar una imagen existente mediante instrucciones descriptivas -como alterar fondos, cambiar materiales, ajustar la iluminación o añadir texto- preservando la integridad del sujeto original.
Sugerencias
- Describa explícitamente qué debe mantenerse sin cambios.
- Describa la modificación con precisión.
- Aclare el estado de ánimo y el tono.
- Incluya sugerencias de posición, como la esquina superior derecha o la superposición del título alineado en el centro.
Ejemplos


Pregunta: "Mantenga el producto idéntico, sustituya el fondo por una pared de hormigón con textura iluminada por una suave luz lateral y superponga la frase "Pure Sound" en una fina fuente blanca con gracias cerca de la parte inferior".


Pregunta: Edita la taza de café sobre una mesa de madera, conservando su forma y logotipo. Sustituye el fondo por una cocina luminosa y añade el texto "Morning Ritual " en relieve dorado sobre la taza.


Pregunta: Sustituye al chico de la imagen por una chica anime con el pelo largo y negro, manteniendo la ropa y las demás partes sin cambios.

Prompt 1: Ponte de pie con una mano en la cadera y la otra formando una V.
Consigna 2: Forma un corazón con las dos manos.
Prompt 3: Sostener con ambas manos una pequeña pizarra que diga "Bienvenido a PicLumen".
Prompt 4: Acerca la cámara.
3. Edición multiimagen
Visión general
Qwen-Image-Edit soporta la combinación de múltiples entradas de imagen - fusionando sujetos y entornos en escenas coherentes.
Sugerencias
- Describa la función de cada imagen.
- Definir cómo deben fusionarse.
- Mantener el realismo.
- Añade una dirección estilística como la luz cinematográfica o la composición editorial.
Ejemplo

Pregunta: "La mujer de la figura 2 está tomando el sol en la tumbona de la figura 1 mientras lleva gafas de sol".
4. Transferencia de estilos y transformación de vistas
Visión general
Qwen-Image permite la reinterpretación estilística y la transformación de puntos de vista, convirtiendo imágenes existentes en nuevas composiciones artísticas o cinematográficas sin perder la integridad estructural.
Sugerencias
- Mencione tanto el estilo de origen como el de destino.
- Define el nuevo ángulo de cámara o punto de vista.
- Incluya señales luminosas y tonales.
- Utiliza referencias artísticas como el póster pop-art o el estilo cómic dibujado a mano.
Ejemplo


Mensaje: "Transforma la imagen en un póster 2D de estilo anime con contornos gruesos, y bloques de color atrevidos; conserva los detalles de la pose y el atuendo".


Pregunta: Transforma la imagen en un boceto monocromo a lápiz en blanco y negro.
5. Edición de texto en imágenes
Visión general
Qwen-Image-Edit puede editar y reemplazar texto directamente dentro de las imágenes - preservando la fuente original, la colocación y efectos como sombras y brillo metálico. Su ventaja sobre otros modelos radica en su capacidad para manejar texto más complejo, como chino, japonés y coreano.
Sugerencias
- Describa el estilo de texto existente.
- Especifique qué debe cambiar.
- Menciona refinamientos como el brillo o el tono de color.
- Mantenga la precisión de las señales de diseño.
Ejemplo


Pregunta: "Cambie el texto "REBAJAS DE VERANO" por "LANZAMIENTO DE VACACIONES" manteniendo idénticos el tipo de letra, el tamaño y la sombra".
Qwen-Image-Edit también admite la sustitución de texto complejo.


Prompt: Cambia el texto "Accesorios de vida de verano" por "夏日生活搭子".

Prompt: Tres chicas de anime que sostienen tres carteles que dicen "欢迎光临", "ようこそ", y "환영합니다", cada uno con diferentes expresiones faciales, de pie delante de un fondo de café.
6. Control avanzado
Visión general
Ahora hemos llegado a mi parte favorita - Qwen-Image-Edit soporta acondicionamiento estilo ControlNet similar a lo que teníamos en la era SDXL. Aún mejor, soporta nativamente tres potentes modos a la vez: OpenPose, Profundidad y Canny.
Sugerencias
- Prepare la imagen que desea utilizar para el control. (En PicLumen, utilice Referencia de imagen en lugar de Control de Imagenya que Qwen se guía directamente por la propia imagen en lugar de por una canalización ControlNet tradicional).
- Describa claramente el resultado visual o el efecto que desea conseguir.
Ejemplo



Pregunta: "La chica de la Figura 2 se cambia a la pose de la Figura 1"
Creación de estímulos eficaces
- Sea descriptivo, no abstracto. Utilice detalles vívidos.
- Especifique los materiales y la iluminación. Términos como mate, terciopelo, brillo de neón ayudan al realismo.
- Utilice señales posicionales claras.
- Enfatice el tono emocional.
- Combinar tema y estilo.
- Iterar y perfeccionar.
- Equilibrio entre imágenes y texto.
- Aproveche la terminología artística conocida.
Casos prácticos
Visuales de marca o campaña

Mensaje: "Un elegante frasco de producto para el cuidado de la piel frente a suaves nubes, el texto del título 'Glow Within' en finas letras plateadas, tranquilos tonos pastel".
Escaparate de productos y merchandising visual

Mensaje: "Zapatillas blancas colocadas sobre suelo negro reflectante con suave foco, texto superpuesto 'Step Ahead' en slim sans-serif".
Ilustración o cartel

Prompt: "Personaje ilustrado de pie en un tejado futurista, título de neón 'NEXT ERA' brillando detrás, iluminación cómica".
Biblioteca Qwen-Image Prompt
1. Cartel editorial moderno

"Mujer con gabardina beige junto a una ventana, título 'THE STYLE ISSUE', subtítulo 'Timeless Design'" . Variación: Hombre con traje, tono blanco y negro, título ' THE CLASS EDITION'".
2. Ilustración artística conceptual

"Chica bajo una farola en una noche lluviosa, ambiente cinematográfico". Variación: Chico junto a coche antiguo bajo luces de neón".
3. Escaparate de productos

"Auriculares inalámbricos sobre superficie negra mate, luz de borde suave, título "Claridad sónica"" .
4. Escena cinematográfica

"Hombre caminando de noche por una calle con niebla, reflejo en la calzada mojada, título 'MIDNIGHT ECHO'" . Variación: Mujer cerca de un coche bajo una luz de neón roja, título 'AFTERGLOW'".
5. Estilo de vida e interiorismo

"Salón minimalista con luz solar, sofá blanco y muebles de madera, texto "Espacios tranquilos"" .
6. Retrato artístico

"Retrato de primer plano extremo con suave luz dorada, El pelo rubio revoloteaba delante de la cara, tono pictórico".
7. Cartel gráfico vintage

"Cartel ilustrado de motocicletas, formas geométricas rojas y beige, título 'SPEED & GRACE'" .
Sugerencias para el uso de prompts
- Céntrate en los materiales, la iluminación y el tono más que en la resolución.
- Combine elementos visuales y textuales.
- Utilice detalles específicos y concretos.
- Afine los resultados utilizando el modo de edición.
- Mantenga un estilo coherente en todas las series.
Conclusión
Qwen-Image fusiona la comprensión de textos, la generación visual y la edición precisa en un solo sistema, lo que permite flujos de trabajo creativos y de diseño de calidad profesional sin necesidad de herramientas de postedición o externas.
El modelo tiene un gran potencial, pero requiere habilidades avanzadas de creación de mensajes para sacar todo su potencial. Otra característica notable de Qwen-Image es que produce resultados relativamente consistentes a través de múltiples generaciones usando el mismo mensaje. Por lo tanto, recomendamos generar sólo una imagen por mensaje, lo quele ayudará a ahorrar tanto lúmenes como tiempo de generación.
Cuando la imagen generada contenga pequeños problemas lógicos o detalles que deban perfeccionarse, puede realizar varias generaciones "cherry-pick" para afinar el resultado.
Con su número de parámetros de modelo 20B, Qwen ofrece enormes posibilidades creativas; ahora te toca a ti dar rienda suelta a tu imaginación. ¡Feliz inspiración!