搜索

--/-- · --°C

--/-- --°C

[[ $t('auth.login') ]] [[ $t('auth.register') ]]

下载 B.News APP

[[ $t('search.unified') ]]

[[ $t('search.title') ]]

“CL-bench” [[ $t('search.found') ]] 1 [[ $t('search.items') ]]

综合 1 文章 1 视频 0 活动 0 播客 0 知识 0

[[ $t('search.hot_badge') ]] [[ $t('search.hot_title') ]]

1 国富置业香港启航：以量子科技赋能资产配置新赛道 2 谷歌亮剑AI编程：重组攻坚队叫板Anthropic 3 MacBook Air一夜暴涨1500块：AI抢走存储产能苹果扛不住了 4 英伟达2026年度股东大会：黄仁勋宣告ROI问题已有答案 5 近23亿港元重磅出手!国富量子获大手笔增持 6 连签两道量子行政令：美国“量子霸权”战略提速 7 OpenAI携手博通发布首款自研AI芯片Jalapeño 8 软银董事长孙正义：要成为全球头号AI机器人企业 9 《蛮猫：未完成的现实》：探索水墨与量子交汇的艺术 10 塔塔电子遭勒索攻击：苹果机密曝光印度替代中国制造再受重创

腾讯混元发布CL-bench评估基准

article 2026-02-04 18:33 B.news

腾讯混元发布CL-bench评估基准

这是姚顺雨加入腾讯后首篇署名论文。该基准专测模型能否从上下文学习新知识并正确应用。结果显示模型平均仅解决17.2%任务，最好的GPT-5.1也才23.7%。这揭示了一个真相：模型还不会真正利用上下文。

人工智能 #CL-bench #AI