
来源:hzdaily.hangzhou.com
蚂蚁集团一周内开源四款具身智能模型,从空间感知到世界建模完整覆盖,试图为机器人打造可复用的"数字大脑"。这是国内首个全栈开源的具身智能方案,也是蚂蚁InclusionAI战略从数字世界向物理世界延伸的关键一跃。
真正的突破是LingBot-VLA的"一脑多机"能力。这款基于2万小时真实机器人数据训练的模型,能在星海图、松灵、乐聚等9种不同构型机器人上直接迁移,无需为每台机器重新训练。在上海交大GM-100基准测试中,其跨本体任务成功率17.3%,超越硅谷标杆Pi0.5的13.0%,将训练效率提升至主流框架的1.5-2.8倍。

来源:Ant Group
蚂蚁的野心不止于控制。LingBot-VA世界模型让机器人"边推演边行动"——输入单张图片即可生成交互式虚拟环境,支持10分钟连续稳定视频生成,为复杂长时序任务提供低成本训练沙盒。这直接对标Google Genie 3,但选择开源路线,与OpenAI的封闭形成反差。
更深层的战略是拒绝仿真陷阱。团队坚持使用真实世界数据而非纯仿真训练,CEO朱兴直言:"只有真机数据才能让模型理解物理世界的摩擦、反光和意外。"这种务实路线与特斯拉Optimus的"数据引擎"逻辑暗合,但蚂蚁选择通过开源生态快速聚集数据飞轮。
四连发的终极目标是构建"机器人安卓"。当波士顿动力还在卖百万美元一台的Atlas,当Figure AI依赖单一机型闭环时,蚂蚁试图用开源模型+国产硬件的组合,降低具身智能落地门槛。2026年被业界视为具身智能元年,而灵波的"通用大脑"或许正让"每个工厂都能有机器人"的愿景提前到来。