3D形状感知模型首超人类

B.news
2026-02-23 16:09:42
伯克利团队用多视图学习突破感知极限。模型无需专门训练即可匹配人类精度。反应时间分布竟与人类表现高度一致。这是通向视觉智能的关键里程碑。

3D形状感知模型首超人类

来源:3uel.com

UC伯克利团队开发的多视图学习模型,首次在3D形状感知任务上达到人类精度,且无需针对该任务专门训练。该模型不仅能预测人类的正确判断,还能预测人类的错误模式和反应时间,揭示模型动态与人类感知之间的自然对应。


传统计算模型在3D形状推理上始终落后于人类。此次突破的关键在于训练方式:模型从自然场景中的多视角图像学习视觉-空间关系,如相机位置和视觉深度,不依赖任何物体相关的归纳偏置。


研究团队让300多名人类和模型做同样的测试。结果模型准确率83%,人类78.9%,统计上没显著差别。更关键的是,人类觉得难的题,模型也觉得难;模型反应时间可预测人类行为动态。这种"错误同步"暗示:模型可能发现了人类大脑也在用的计算策略。


MIT Technology Review在2016年曾报道AI从2D走向3D的趋势,称这是"从像素到世界的转变"。这篇论文证明,这个转变不需要复杂设计——简单的多视图学习目标,就能让人工智能涌现人类水平的3D感知。


所有代码和数据已公开。当AI开始像人一样"看"世界,机器人导航、自动驾驶、虚拟现实或许将迎来真正的质变。


编辑:Laverne

AI