(图片来源:Qwen)据官方介绍,Qwen-Image-2.0支持“生图编辑二合一”,同一模型可覆盖文生图与图生图任务,并在AI Arena的盲测对比中取得较优表现。官方给出的示例包括直接生成“发展历程PPT页”、多层结构信息图,以及带“画中画”元素的组合版面。
(图片来源:Qwen)在指令理解上,Qwen-Image-2.0将提示词长度扩展到1k token级别,面向复杂排版与多元素画面输出。官方展示的典型应用包含A/B测试报告页、OKR方法图、双语海报等,目标是让模型生成的图像更接近“可直接交付”的内容成品,而不仅是艺术风格图。
“文字渲染”被官方拆解为五个关键词:准、多、美、真、齐。其含义分别指向文字准确度、复杂度承载能力、版式美观、材质与写实一致性,以及表格/对话框/段落的对齐规整。官方举例称,模型倾向把文字放在画面留白区域以减少遮挡,并支持在不同介质(如玻璃、衣物、杂志)上进行更贴合材质的文字呈现。
分辨率与细节是另一条主线。官方称Qwen-Image-2.0原生支持2048×2048输出,并强调对皮肤纹理、织物质感、建筑细节等写实信息的刻画能力。相关示例还包括“写实画面+文字”的海报类任务,重点在于文字清晰与画面真实感同时成立。
在编辑能力上,官方将其定位为“理解与生成融合”的统一能力:同一模型既能生成新图,也能在已有图像上完成题词、局部调整、多图合成等操作。文字渲染能力提升也会反哺编辑场景,例如可直接在图片上添加题词与说明文字。
从产品化路径看,Qwen-Image-2.0已在阿里云百炼平台开通API邀请测试,开发者也可通过Qwen Chat免费体验。对应用侧而言,API邀测意味着模型将以云端服务形态进入工作流,可能更适配电商素材、品牌运营、企业汇报与投放创意等批量生产需求。Source:Qwen IT之家
编辑:Vivian