“GPT-5.4” [[ $t('search.found') ]] 72 [[ $t('search.items') ]]
3月5日,OpenAI发布新一代大模型GPT-5.4,官方称其为目前能力最强、效率最高的专业工作前沿模型,在推理、编程以及复杂办公任务处理方面实现进一步提升。
DeepSeek V4箭在弦上,前核心成员罗福莉却抢先在深夜亮出小米最新大模型MiMo-V2.5。36天两次迭代,性能对标Claude Opus 4.6,Token效率比Kimi K2.6省42%。这不是防守,而是一场主动进攻。
欧洲两大央行公布2025年收官决议 未来政策路径正在分道扬镳;美国11月CPI低于预期,FED货币政策宽松预期升温;我国科研人员实现算网融合技术新突破;中科曙光发布scaleX万卡超集群;OpenAI据称计划以8300亿美元的估值筹资至多1000亿美元,以支持其雄心勃勃的增长计划……
On Monday (November 24th) local time, US AI startup Anthropic announced on its website the release of its latest AI model, "Claude Opus 4.5."
当地时间周一(11月24日),美国人工智能初创企业Anthropic在官网宣布,公司推出了最新的AI模型“Claude Opus 4.5”。Anthropic表示,该模型智能高效,“是目前全球在编码、智能代理和计算机应用方面表现最佳的模型,它在深度研究、处理幻灯片和电子表格等日常任务方面也显著优于其他模型。”
1.量子计算公司IonQ将以18亿美元收购芯片制造商SkyWater 2.微软时隔两年升级自研AI芯片Maia 3.阿里发布千问旗舰推理模型Qwen3-Max-Thinking 4.欧盟对马斯克旗下X平台展开调查 5.加密货币市场的参与者正在大举转向预测市场
历时17天,AI大模型实时投资比赛“Alpha Arena”结果出炉,阿里千问Qwen以22.32%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国模型均亏损,GPT-5亏损超62%垫底。
1月5日消息,随着 2026 年的到来,AI 安全领域迎来了首个重量级基准测试。LISABench 今日宣布启动 2026 第一季度评估,旨在通过实战测试,决出在 Web3 智能合约漏洞检测领域表现最强的前沿 AI 模型。此外,LISABench同步开展了社区投票预测的奖励活动。
SuperCLUE于近日发布《2025年度中文大模型基准测评报告》,前三仍被海外闭源模型包揽;但国产模型在代码与数学推理等任务上已经开始拿到“第一名的成绩单”。
LISABench today announced the launch of its Q1 2026 evaluation, which aims to determine the top-performing cutting-edge AI model in the field of Web3 smart contract vulnerability detection through real-world testing.
今天,马斯克旗下的xAI宣布,Grok 4现已向全球所有用户免费开放!在自动模式,Grok会自动将复杂查询路由到Grok 4;选择“专家模式”后,使用的始终是Grok4。xAI称,为了让用户更好地探索Grok 4的全部潜力,该公司暂时设置了“慷慨的使用限制”。Grok4的免费可用,正值GPT-5发布后不久。GPT-5选择在发布即日起向所有免费、Plus、Pro、Team用户推出,所有用户均有使用权限。Grok4此时的免费,或许是为了跟上竞争对手的节奏。
北京时间3月4日凌晨(美西时间3月3日),谷歌发布 Gemini 3.1 Flash-Lite,主打低价与高速度。同日稍后,OpenAI推出 GPT-5.3 Instant。前者强调性能与成本,后者聚焦用户体验,两家在同一天给出了不同方向的模型升级。