智谱华为联手:国产全栈训练生图模型问世API调用仅0.1元/张

B.news
2026-01-15 09:25:37
智谱与华为近日联合开源新一代图像生成模型GLM-Image。该模型基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架,实现了从数据预处理到大规模训练的全流程构建,成为首个在国产芯片上完成全程训练并达到SOTA水平的多模态模型。

智谱华为联手:国产全栈训练生图模型问世API调用仅0.1元/张

此次合作标志着国产AI全栈生态建设迈入新阶段,不仅验证了在自主算力底座上训练前沿模型的可行性,也展现出中国在人工智能领域的自主创新能力。

GLM-Image采用创新的自回归与扩散编码器混合架构,有效解决了海报、PPT、科普图等知识密集型场景下的生成难题。模型在CVTG-2K(复杂视觉文本生成)与LongText-Bench(长文本渲染)榜单中均位列开源第一,尤其在汉字生成任务上表现突出,实现了对文本的精准识别与规范生成,有力应对了长期以来AI生图中“识文难、写对更难”的行业痛点。

在应用层面,GLM-Image具备显著的高性价比优势:在API调用模式下,单张图片生成成本仅为0.1元,相当于国际同类闭源产品价格的1/10至1/3。此外,其速度优化版本也即将推出,进一步保障生成效率。

智谱相关负责人表示:“GLM-Image是我们面向认知型生成技术范式的重要探索,也是首个开源的、具备工业表现级的离散自回归图像生成模型。我们希望通过开源,与社区共同推进‘知识+推理’型生成模型的发展,迈向以Nano Banana Pro为代表的新一代认知生成模型。”

该模型已能够实时、准确地生成AI手抄报、插画、海报等内容,为视觉创作提供了可靠高效的国产化解决方案。(来源:财联社)