根据OpenAI披露的信息,相比此前版本GPT-5.2,GPT-5.4在多项核心能力上实现明显升级。其中,推理能力和编程能力得到强化,在电子表格处理、PPT制作等复杂办公场景中的表现也更加突出。业内人士认为,这一方向显示出大模型正在进一步向企业级办公和专业生产场景渗透。
此次更新推出了两个版本:GPT-5.4 Thinking和GPT-5.4 Pro。前者主要针对复杂推理任务,向Plus、Team以及Pro订阅用户开放,并将取代此前的GPT-5.2 Thinking;而性能更高的GPT-5.4 Pro则主要面向企业级客户,满足更高强度的专业需求。按照官方计划,GPT-5.2 Thinking将于2026年6月5日正式下线。
GPT-5.4的一项重要变化是首次在通用模型中引入原生电脑操控能力。模型不仅能够生成文本或代码,还可以根据屏幕截图理解当前界面,并直接操作电脑软件或浏览网页,通过控制鼠标和键盘完成任务。同时,该能力还可以与电子表格、金融分析工具等企业应用进行整合,从而帮助用户完成更复杂的工作流程。
与此同时,GPT-5.4在API与Codex中支持最高100万token的上下文窗口,是OpenAI目前提供的最大上下文容量。这一能力可以支持更长链路的任务处理,例如多步骤项目规划、文档分析以及复杂数据处理等。
价格方面,GPT-5.4的API定价相比GPT-5.2略有上涨。每百万输入token价格为2.5美元,输出token为15美元。性能更高的GPT-5.4 Pro价格则为每百万输入token 30美元、输出token 180美元。不过OpenAI表示,由于模型效率提升,在许多实际应用场景中总体成本可能反而下降。
(图片来源:OpenAI)
人工智能正在逐步成为企业和个人工作中的重要工具。GPT-5.4的发布,也被视为AI向“数字员工”迈进的一次重要升级。
B.News科技记者Vivian