“Claude Sonnet 4” [[ $t('search.found') ]] 51 [[ $t('search.items') ]]
近期围绕伊朗冲突的讨论中,一个词频繁出现——“杀伤链压缩”。AI系统正通过情报筛选与目标排序不断缩短决策时间。如果把这种节奏推向战略层面:当AI被放进国家安全决策的位置,它会如何选择?一项核危机推演让 GPT-5.2、Claude Sonnet 4 和 Gemini 3 Flash 扮演“国家领导人”。结果显示,对抗很少回到缓和,升级动作成为更常见的选择,在多数对局中甚至跨过了战术核使用门槛。
12月24日消息,Aster交易所“人类 vs AI”实盘交易对抗赛正式结束,AI团队亏损控制在1.3万美元,投资回报率为-4.48%;人类团队则大幅亏损22.5万美元,ROI为-32.21%。领先的AI策略“Claude Sonnet 4.5 Aggressive”账户余额1.8万美元。人类阵营中,ProMint以盈利1.36万美元(账户余额2.365美元)居总榜首,获得冠军,将赢得10万美元奖金。小侠和Romanson等也实现正收益,昨日盈利领先的交易员Tippy的余额显
历时17天,AI大模型实时投资比赛“Alpha Arena”结果出炉,阿里千问Qwen以22.32%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国模型均亏损,GPT-5亏损超62%垫底。
On Monday (November 24th) local time, US AI startup Anthropic announced on its website the release of its latest AI model, "Claude Opus 4.5."
当地时间周一(11月24日),美国人工智能初创企业Anthropic在官网宣布,公司推出了最新的AI模型“Claude Opus 4.5”。Anthropic表示,该模型智能高效,“是目前全球在编码、智能代理和计算机应用方面表现最佳的模型,它在深度研究、处理幻灯片和电子表格等日常任务方面也显著优于其他模型。”
LISABench today announced the launch of its Q1 2026 evaluation, which aims to determine the top-performing cutting-edge AI model in the field of Web3 smart contract vulnerability detection through real-world testing.
1月5日消息,随着 2026 年的到来,AI 安全领域迎来了首个重量级基准测试。LISABench 今日宣布启动 2026 第一季度评估,旨在通过实战测试,决出在 Web3 智能合约漏洞检测领域表现最强的前沿 AI 模型。此外,LISABench同步开展了社区投票预测的奖励活动。
5月8日,Anthropic宣布Claude for Microsoft 365正式向所有付费用户开放。这意味着Claude已全面打通Excel、PowerPoint、Word和Outlook,实现了AI助手的跨应用上下文共享。
手把手教你使用 Claude MCP 协议搭建 AI Agent 工作流。
Anthropic 最新旗舰模型在编程基准测试中取得突破性成绩。
xAI解散,算力租给Claude,马斯克在法庭上起诉奥特曼——他不想打模型战了,他要当AI时代的“电网公司”。这场牌桌,被他掀了。
OpenAI与Anthropic围绕AI编程工具的竞争正加速升温。就在Anthropic的Claude Code被多家企业列为首选工具后,OpenAI迅速作出回应,对旗下编程助手Codex进行了大规模升级。北京时间4月17日,OpenAI宣布为Codex新增多项重磅功能,包括后台操控Mac电脑、多智能体并行运行等,被业界视为对Anthropic的直接反击。