
来源:blog.csdn.net
面壁智能于2月4日开源MiniCPM-o 4.5,这只有9B参数的"小钢炮"首次实现全双工全模态交互——能边看边听边说,还能主动打断对话。相比GPT-4o的"轮流发言"式交互,它更像真人聊天:你画兔子耳朵时它会抢话猜测,你沉默时它会主动提醒,甚至能感知敲门声并询问是否需要暂停。
技术突破在于打破"单工枷锁"。传统AI像对讲机,说时不能听,听时不能说;MiniCPM-o 4.5用自主交互机制让模型在输出同时保持感知,实时观察环境变化并即时反应。在OpenCompass综合评估中得分77.6,多项视觉理解任务击败Gemini 2.5 Flash,而内存占用仅为同级别模型的45%。

来源:blog.csdn.net
面壁CEO李大海将其归因于"知识密度定律"——模型能力每3.3个月翻倍,参数却持续压缩。十年前大模型需要云端超算,如今9B参数就能跑在普通平板;他预言再过十年,将有1000亿硬件搭载端侧智能,届时"Her"将无处不在。
开源策略更凸显野心。MiniCPM-o 4.5采用Apache 2.0协议完全开源,连训练代码和1800万帧视频-语音-文本交错数据一并放出。这与OpenAI的封闭形成反差:当GPT-4o的"高级语音模式"仍在排队候补时,开发者已能在GitHub下载"活的她",用几行代码造出自己的AI伴侣。
真正的颠覆在于情感计算。面壁团队发现,用户更愿向能主动打断、会犯小错的AI倾诉——完美反照反而显得冰冷。这种"有瑕疵的真实"或许比Siri的礼貌更接近人性,也让"开源版Her"从技术演示变成可触摸的产品。
编辑:Laverne