
来源:techinasia.com
春节红包还没发完,国产大模型已急着抢滩登陆。智谱GLM-5定档2月15日前亮相,主打创意写作、编程与推理能力三角突破;MiniMax M2.2则押注"程序员秘密武器"定位,以230B参数MoE架构专攻端到端开发工作流。两家都选在年前发布,意在用假期流量空档完成用户心智占领。

来源:techinasia.com
DeepSeek却反常地选择"闭关"。官方仅对V3系列进行小幅更新,真正的万亿参数旗舰被曝因训练周期延长而延后,这种"让跑"策略与其年初震惊行业的激进风格形成反差。或许梁文峰团队正在憋更大的招,或许只是算力受限下的务实选择。
真正的变量在字节与阿里。豆包与通义千问的新版本尚未官宣,但两家握有流量入口与云计算基础设施的绝对优势,年后一旦入场,势必将已白热化的价格战推向新的冰点。当GLM-5和M2.2还在争夺"开源第一"头衔时,闭源巨头的降维打击或许已在路上。
编辑:Laverne