腾讯混元图像3.0上线：主打指令编辑与多图融合

B.news

2026-02-02 10:12:01

腾讯混元近期推出 HunyuanImage 3.0-Instruct（混元图像3.0图生图/指令版），定位从“生成一张图”进一步走向更贴近生产流程的可控编辑。

图片来源：msn.cn

腾讯混元近期推出 HunyuanImage 3.0-Instruct（混元图像3.0图生图/指令版），定位从“生成一张图”进一步走向更贴近生产流程的可控编辑：支持图片编辑、以及多张参考图的融合生成，并同步在腾讯“元宝”上线。

从开源侧披露的信息看，HunyuanImage-3.0 项目更新中明确列出 HunyuanImage-3.0-Instruct（with reasoning），并将“智能提示词增强、Image-to-Image、多轮交互、蒸馏版本、vLLM 支持”等列为开放计划的一部分。

在模型规格上，Hugging Face 的模型卡显示，HunyuanImage-3.0 采用 MoE 架构：总参数约 80B、每 token 激活约 13B，并给出了多 GPU 推理等部署建议。

团队在技术报告中将 HunyuanImage 3.0 描述为“原生多模态、统一理解与生成的自回归框架”，并强调通过数据治理、架构设计、原生 CoT 方案与后训练等手段提升图文对齐与视觉质量。

对应用侧而言，指令编辑与多图融合能力的补齐，意味着模型的价值点从“灵感图”转向更可落地的“改图工具”：例如电商物料换背景/补细节、营销海报多素材融合、内容平台批量出图等场景，能直接嵌入工作流而非只停留在 demo。(Source: Tencent-Hunyuan GitHub)

编辑：Vivian