当前位置: 首页 > news >正文

GPT-5.4 深夜上线!百万上下文+原生操作电脑,OpenClaw 天选模型来了!【附GPT升级教程】

就在今天深夜,OpenAI继GPT5.3 Instant之后又推出了一个全新模型——GPT 5.4

OpenAI 对 GPT-5.4 的定位是:面向专业工作的最强、最高效的前沿模型,并且它已经同时上线 ChatGPT、API 和 Codex。另外还有更高规格的 GPT-5.4 Pro。

GPT-5.4 还是 OpenAI 首个把 GPT-5.3-codex 级代码能力并入主线推理模型的版本,也就是不再把“会写代码”和“懂业务/懂知识”分在两个模型上。

那么,它本次更新最核心的加强点在哪呢?我们要怎么快速升级到GPT-5.4呢?为什么说它是OpenClaw的天选模型呢?另外OpenClaw该如何切换到GPT-5.4呢?

GPT-5.4 的核心加强点

真实工作能力明显增强

这次 GPT-5.4 最核心的提升,不是单一学术跑分,而是真实专业工作任务

  • GDPval(真实专业工作任务表现):GPT-5.4 为83.0%,GPT-5.2 为70.9%,提升12.1 个百分点
  • Investment Banking Modeling Tasks(内部投行建模评测):GPT-5.4 为87.3%,GPT-5.2 为68.4%,提升18.9 个百分点
  • OfficeQA(企业文档推理能力):GPT-5.4 为68.1%,GPT-5.2 为63.1%

这说明 GPT-5.4 的提升重点不是“更会考试”,而是更接近真实办公、分析、报告、建模、执行型知识工作

代码能力保住了,而且进入主线模型

GPT-5.4 最大的价值之一,是它没有为了加强通用能力而牺牲代码能力。

  • SWE-Bench Pro(Public):GPT-5.4 为57.7%
  • GPT-5.3-Codex 为56.8%
  • GPT-5.2 为55.6%

也就是说,GPT-5.4 基本把GPT-5.3-Codex 那一档的工程能力接到了主线模型里,同时补上了知识理解和业务表达能力。

需要注意的是,Terminal-Bench 2.0上 GPT-5.4 是75.1%,低于 GPT-5.3-Codex 的77.3%,所以更准确的说法不是“全维度代码都碾压 Codex”,而是:在关键公开软件工程基准上略强,整体工程能力已进入 Codex 档位,但并非每个 coding benchmark 都全面领先。

电脑操作能力是这次最亮眼的升级之一

GPT-5.4 是 OpenAI首个原生支持 computer use 的主线通用模型。官方描述里,它可以结合屏幕内容进行鼠标、键盘等操作,并且面向跨步骤任务。

关键数据:

  • OSWorld-Verified:GPT-5.4 为75.0%
  • GPT-5.3-Codex 为74.0%
  • GPT-5.2 为47.3%

如果和 Anthropic 官方公布的成绩对比,Claude Opus 4.672.7%

从官方可核对数据来看,GPT-5.4 目前在这个基准上略高于 Claude Opus 4.6

我们也可以从官方视频中直观体验到操作流畅度

工具使用和 Agent 能力更强

OpenAI 这次还重点强化了 GPT-5.4 的工具调用与 agentic 工作流能力

  • BrowseComp:GPT-5.4 为82.7%,GPT-5.2 为65.8%
  • Toolathlon:GPT-5.4 为54.6%,GPT-5.2 为45.7%
  • MCP Atlas:GPT-5.4 为67.2%,GPT-5.2 为60.6%

另外,OpenAI 还明确提到 GPT-5.4 支持tool search这一类机制:不是把全部工具定义都塞进上下文,而是需要时再检索工具定义。这对于工具很多的 Agent 系统,能减少上下文浪费,提升效率。

百万上下文

API 官方页面给出的 GPT-5.4 参数是:

  • 上下文窗口:1,050,000 tokens
  • 最大输出:128,000 tokens

价格方面:

  • gpt-5.4:输入$2.50 / 1M tokens,缓存输入$0.25 / 1M,输出$15 / 1M
  • gpt-5.4-pro:输入$30 / 1M,输出$180 / 1M

同时官方说明,当输入超过 272K tokens时,GPT-5.4 / GPT-5.4 Pro 会按更高费率计费。

GPT-5.4 与目前主流模型对比

和 GPT-5.3-Codex 比

更准确的说法不是“全面吊打”,而是:

  • 代码主干能力已经接近甚至略强于 GPT-5.3-Codex
  • 世界知识、业务理解、事实性、专业工作能力明显更完整
  • 电脑操作与工具使用也更均衡

所以 GPT-5.4 的价值在于:它把 Codex 的工程腿补进了主线模型,但同时保留了通用模型该有的表达和知识能力。

和 Claude Opus 4.6 比

从官方可核对数据看:

  • OSWorld上,GPT-5.475.0%,Claude Opus 4.672.7%

但不能简单说“GPT-5.4 全面赢过 Claude”。更准确的结论是:
GPT-5.4 在 OpenAI 这次主打的专业工作、工具使用、电脑操作方向上非常强,而且价格比 GPT-5.4 Pro 友好得多;Claude 依然在部分工程体验和一些场景中有自己的优势。

和 Gemini 3.1 Pro 比

Gemini 3.1 Pro 的优势主要集中在 科学推理和数学类benchmark。例如在 GPQA Diamond(博士级科学问题):

  • GPT-5.4 Pro:94.4%
  • Gemini 3.1 Pro:约 94% 左右

两者基本处于同一水平。

而在 FrontierMath(高等数学),GPT-5.4 Pro 略强。

不过在一些 浏览与信息搜索类任务(例如 BrowseComp)中,Gemini 系列模型也有不错表现。

综合对比

从整体 benchmark 分布来看,三家模型的能力结构逐渐分化:

  • GPT-5.4:Agent 执行能力最强(工具、电脑操作、工作任务)
  • Claude Opus 4.6:写作与复杂代码任务依然表现稳定
  • Gemini 3.1 Pro:科学推理和搜索类任务更突出

👉因此如果是 Agent 框架或自动化系统(例如 OpenClaw),GPT-5.4 目前是更均衡的基座模型选择。

GPT-5.4 特别适配 OpenClaw?

这一点可以直接从 OpenClaw 需要的“基座模型能力结构”来理解。

OpenClaw 这类 Agent/自动化框架,本质上最需要四件事:

要有稳定的代码能力

OpenClaw 要做任务编排、脚本执行、工具调用、页面操作、报错修复,底层离不开代码能力。GPT-5.4 在 SWE-Bench Pro 上57.7%,已经进入 GPT-5.3-Codex 这一档。

要有足够强的世界知识和业务理解

单纯会写代码,不代表能理解任务目标、业务语义、用户意图。GPT-5.4 在 GDPval、OfficeQA、投行建模这些更接近真实工作的基准上都显著强于 GPT-5.2,说明它更适合做“不是纯编程”的 Agent。

要能看、能用工具、能跨步骤执行

OpenClaw 的价值不只是“聊天”,而是执行。GPT-5.4 这次在OSWorld-Verified 75.0%Toolathlon 54.6%BrowseComp 82.7%的表现,说明它更适合作为执行型模型,而不只是回答型模型。

成本和上下文要扛得住

Agent 系统最怕两件事:太贵,以及上下文不够长。GPT-5.4 API 价格是$2.5 / $15,上下文是1.05M,对于需要长任务链、长文档、长代码仓库的场景,比“高价旗舰但难大规模跑”的方案更容易落地。

👉GPT-5.4 把 GPT-5.3 Codex 的强代码能力、比 GPT-5.2 更全面的世界知识、更出色的工具使用能力,以及便宜到离谱的 Codex 额度集于一身——这四项优势合体,足以让它成为 OpenClaw 的完美天选基座模型。

如何使用到GPT-5.4呢?

面向群体有哪些?

即日起,GPT-5.4 向 ChatGPTGo、Plus、Team 和 Pro 等付费用户开放,替代 GPT-5.2 Thinking 成为默认思考模型,GPT-5.4 Pro 目前仅面向 Pro 和 Enterprise 计划开放

在 ChatGPT 中:

  • GPT-5.4 以GPT-5.4 Thinking的形式提供给付费用户。
  • Plus / Business用户手动选择 GPT-5.4 Thinking,额度为每周最多 3000 条消息
  • Go用户启用 Thinking 后,额度是每 5 小时 10 条

之后也会陆续在 API 和 Codex 上逐步推送,Codex可以直接更新切换模型

API的整体价格如下:

相比下看价格还是有所提升的,但已经比Claude便宜很多了,但性价比绝对比claude高的。

如何快速升级GPT5.4?

如果你有自己的GPT账号,但苦于没有虚拟卡、海外信用卡,也不知道找稳定的升级方法

那你可以通过我们的OpenAI 自助代充平台,完全不用找代充、也不用担心被骗,我们会全程提供质保售后服务,已稳定充值半年多了!!!

  • 其他地区正规官方充值
  • 支持24 小时自助升级
  • 无需海外卡,两分钟搞定
  • 低于0.01%封号率,包质保

直达入口👉:gptplus.uno

(复制到浏览器中打开)

👉不管你是充值Go、Plus、Pro,还是Business(team),都可以在商城中找到(部分较高费用的将人工特殊处理)

OpenClaw如何切换到GPT5.4?

OpenClaw 现在是支持 OpenAI 的,而且分两种方式:

  • 用 ChatGPT/Codex 登录(OAuth,走订阅额度)
  • 用 OpenAI API Key(走 API 计费,或第三方平台)

直接切到 ChatGPT 授权,最直接的是跑 OpenClaw 的向导:

openclaw onboard

在向导里选 OpenAI Code (Codex) subscription / OpenAI Codex OAuth 这一类选项。OpenClaw 官方文档给的等价命令是:

openclaw onboard --auth-choice openai-codex

如果你已经装好了,只是想补登录,也可以用:

openclaw models auth login--provideropenai-codex

这一步会拉起浏览器,让你 Sign in with ChatGPT 完成授权。OpenAI 官方的 Codex 认证文档也确认:Codex 支持 Sign in with ChatGPT 和 API key 两种登录方式

如果你想一步到位,基本就是这套:

openclaw onboard --auth-choice openai-codex

浏览器里登录 ChatGPT 后,再把默认模型改成:

openai-codex/gpt-5.4

如果你是手改配置,就把agents.defaults.model.primary改成上面这个值。OpenClaw 官方模型文档说明,默认主模型就是在这个配置键里设的。

👉更简单的方法:在服务器上装个codex,把需要信息发给codex,让他帮你配置并切换到gpt-5.4,"手残党"福星!!!!

最后有话说

一句话总结:GPT-5.4 最重要的不是更强,而是更完整。它把 Agent 真正需要的几块能力,第一次比较像样地拼到了一起。

也正因为这种“完整度”的提升,它才不只是一个新模型,更像是 2026 年这一波 AI 从“会回答”继续往“会执行”推进时,一个很关键的节点。

可能2026年之前大家都在卷模型,而现在是卷Agent…

http://www.jsqmd.com/news/490797/

相关文章:

  • Matplotlib绘制拆线图自定义曲线颜色显示
  • JAVA今日面经(一)
  • 发电机组并网技术研究
  • 工业物联网百科全书
  • 立创开源广场自动签到脚本V1.1
  • KMP算法之 next 数组的计算
  • 净水器行业的下一步:从卖设备到卖服务
  • 「OpenClaw 实战全攻略」:从打造 Second Brain 到服务器自愈,20+ 真实落地场景解析
  • 欧洲十家运营商联手对抗星链:一场关于天空的“地缘保卫战”
  • 第六讲:OpenClaw+Deepseek+飞书低成本安装龙虾指南(最新)
  • SceneV:基于Vue3与ThingsBoard的高性能低代码组态可视化解决方案
  • 底部填充胶 (Underfill) 怎么选?AI 算力芯片与 CoWoS 先进封装导热用胶白皮书—37W/m·K 高导热与 13ppm 极低 CTE :峻茂芯片级应力管理指南
  • 高级java每日一道面试题-2025年8月27日-基础篇[LangChain4j]-如何审计 LLM 的输入输出?
  • 2025_NIPS_Transformer brain encoders explain human high-level visual responses
  • Select、Poll、Epoll详解:核心区别与实战用法
  • coding plan vs token
  • 高级java每日一道面试题-2025年8月28日-业务篇[LangChain4j]-如何使用 LangChain4j 实现智能投研助手?需要处理哪些金融数据源?
  • LeetCode Hot100(66/100)——118. 杨辉三角
  • Qt进程间通信
  • LeetCode Hot100(68/100)——198. 打家劫舍
  • 【LLM进阶-Agent】13.function call vs mcp vs skills
  • 2025_NIPS_EgoExoBench: A Benchmark for First- and Third-person View Video Understanding in MLLMs
  • 告别绘图软件!Paperxie AI 科研绘图:10 次免费额度,让理工科论文可视化一步到位
  • Tower I3C Host Adapter 使用范例 (20)
  • 【C++】左值引用、右值引用
  • CS二开之睡眠混淆(五)BeaconGate,UDRL,Sleepmask组合拳
  • AI新范式 02|拆解世界模型:它是如何理解物理规律的?
  • WebRTC QoS方法之NetEQ在流量卡弱网应用下失效
  • Java基础-1
  • 2025_NIPS_Scaling RL to Long Videos