3D形状感知模型首超人类

B.news

2026-02-23 16:09:42

伯克利团队用多视图学习突破感知极限。模型无需专门训练即可匹配人类精度。反应时间分布竟与人类表现高度一致。这是通向视觉智能的关键里程碑。

3D形状感知模型首超人类

来源：3uel.com

UC伯克利团队开发的多视图学习模型，首次在3D形状感知任务上达到人类精度，且无需针对该任务专门训练。该模型不仅能预测人类的正确判断，还能预测人类的错误模式和反应时间，揭示模型动态与人类感知之间的自然对应。

传统计算模型在3D形状推理上始终落后于人类。此次突破的关键在于训练方式：模型从自然场景中的多视角图像学习视觉-空间关系，如相机位置和视觉深度，不依赖任何物体相关的归纳偏置。

研究团队让300多名人类和模型做同样的测试。结果模型准确率83%，人类78.9%，统计上没显著差别。更关键的是，人类觉得难的题，模型也觉得难；模型反应时间可预测人类行为动态。这种"错误同步"暗示：模型可能发现了人类大脑也在用的计算策略。

MIT Technology Review在2016年曾报道AI从2D走向3D的趋势，称这是"从像素到世界的转变"。这篇论文证明，这个转变不需要复杂设计——简单的多视图学习目标，就能让人工智能涌现人类水平的3D感知。

所有代码和数据已公开。当AI开始像人一样"看"世界，机器人导航、自动驾驶、虚拟现实或许将迎来真正的质变。

编辑：Laverne