腾讯混元图像3.0上线:主打指令编辑与多图融合

B.news
2026-02-02 10:12:01
腾讯混元近期推出 HunyuanImage 3.0-Instruct(混元图像3.0图生图/指令版),定位从“生成一张图”进一步走向更贴近生产流程的可控编辑。

腾讯混元图像3.0上线:主打指令编辑与多图融合

图片来源:msn.cn

腾讯混元近期推出 HunyuanImage 3.0-Instruct(混元图像3.0图生图/指令版),定位从“生成一张图”进一步走向更贴近生产流程的可控编辑:支持图片编辑、以及多张参考图的融合生成,并同步在腾讯“元宝”上线。

从开源侧披露的信息看,HunyuanImage-3.0 项目更新中明确列出 HunyuanImage-3.0-Instruct(with reasoning),并将“智能提示词增强、Image-to-Image、多轮交互、蒸馏版本、vLLM 支持”等列为开放计划的一部分。

在模型规格上,Hugging Face 的模型卡显示,HunyuanImage-3.0 采用 MoE 架构:总参数约 80B、每 token 激活约 13B,并给出了多 GPU 推理等部署建议。

团队在技术报告中将 HunyuanImage 3.0 描述为“原生多模态、统一理解与生成的自回归框架”,并强调通过数据治理、架构设计、原生 CoT 方案与后训练等手段提升图文对齐与视觉质量。

对应用侧而言,指令编辑与多图融合能力的补齐,意味着模型的价值点从“灵感图”转向更可落地的“改图工具”:例如电商物料换背景/补细节、营销海报多素材融合、内容平台批量出图等场景,能直接嵌入工作流而非只停留在 demo。(Source: Tencent-Hunyuan GitHub)

编辑:Vivian