阶跃星辰开源Step 3.5 Flash

B.news
2026-02-02 14:08:31
阶跃星辰发布新一代开源基座模型 Step 3.5 Flash,定位面向实时 Agent 工作流,主打“高推理效率+低延迟”。
阶跃星辰开源Step 3.5 Flash(图片来源:msn.cn)

从官方介绍来看,Step 3.5 Flash 走的是“效率优先”的路线:采用稀疏 MoE 架构,总参数约 196B、每个 token 只激活约 11B,并用“智能密度”的说法来解释——在不牺牲推理深度的前提下,把响应速度拉到可用于多步决策与工具调用的节奏。 

更贴近开发者体感的,是它对“能不能跑起来、跑得动”的强调。官方给出的典型生成吞吐为 100–300 tok/s,单流代码任务峰值可到 350 tok/s;同时还把 256K 长上下文、本地部署(如高端消费级设备/工作站)写进了能力清单,明显在对标“长文档/长代码 + 低延迟”的 Agent 场景。 

 此外,人民财讯的快讯提到,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商已完成对 Step 3.5 Flash 的适配;这类“先适配、再扩生态”的路径,通常会直接影响模型后续在企业工具链与行业方案里的扩散速度。Source:Hugging face模型页 人民财讯

编辑:Vivian