当前位置：首页 > news >正文

GPT-5.4 深夜上线！百万上下文+原生操作电脑，OpenClaw 天选模型来了！【附GPT升级教程】

news 2026/3/26 18:44:44

就在今天深夜，OpenAI继GPT5.3 Instant之后又推出了一个全新模型——GPT 5.4

OpenAI 对 GPT-5.4 的定位是：面向专业工作的最强、最高效的前沿模型，并且它已经同时上线 ChatGPT、API 和 Codex。另外还有更高规格的 GPT-5.4 Pro。

GPT-5.4 还是 OpenAI 首个把 GPT-5.3-codex 级代码能力并入主线推理模型的版本，也就是不再把“会写代码”和“懂业务/懂知识”分在两个模型上。

那么，它本次更新最核心的加强点在哪呢？我们要怎么快速升级到GPT-5.4呢？为什么说它是OpenClaw的天选模型呢？另外OpenClaw该如何切换到GPT-5.4呢？

GPT-5.4 的核心加强点

真实工作能力明显增强

这次 GPT-5.4 最核心的提升，不是单一学术跑分，而是真实专业工作任务。

GDPval（真实专业工作任务表现）：GPT-5.4 为83.0%，GPT-5.2 为70.9%，提升12.1 个百分点。
Investment Banking Modeling Tasks（内部投行建模评测）：GPT-5.4 为87.3%，GPT-5.2 为68.4%，提升18.9 个百分点。
OfficeQA（企业文档推理能力）：GPT-5.4 为68.1%，GPT-5.2 为63.1%。

这说明 GPT-5.4 的提升重点不是“更会考试”，而是更接近真实办公、分析、报告、建模、执行型知识工作。

代码能力保住了，而且进入主线模型

GPT-5.4 最大的价值之一，是它没有为了加强通用能力而牺牲代码能力。

SWE-Bench Pro（Public）：GPT-5.4 为57.7%
GPT-5.3-Codex 为56.8%
GPT-5.2 为55.6%

也就是说，GPT-5.4 基本把GPT-5.3-Codex 那一档的工程能力接到了主线模型里，同时补上了知识理解和业务表达能力。

需要注意的是，Terminal-Bench 2.0上 GPT-5.4 是75.1%，低于 GPT-5.3-Codex 的77.3%，所以更准确的说法不是“全维度代码都碾压 Codex”，而是：在关键公开软件工程基准上略强，整体工程能力已进入 Codex 档位，但并非每个 coding benchmark 都全面领先。

电脑操作能力是这次最亮眼的升级之一

GPT-5.4 是 OpenAI首个原生支持 computer use 的主线通用模型。官方描述里，它可以结合屏幕内容进行鼠标、键盘等操作，并且面向跨步骤任务。

关键数据：

OSWorld-Verified：GPT-5.4 为75.0%
GPT-5.3-Codex 为74.0%
GPT-5.2 为47.3%

如果和 Anthropic 官方公布的成绩对比，Claude Opus 4.6：72.7%

从官方可核对数据来看，GPT-5.4 目前在这个基准上略高于 Claude Opus 4.6。

我们也可以从官方视频中直观体验到操作流畅度

工具使用和 Agent 能力更强

OpenAI 这次还重点强化了 GPT-5.4 的工具调用与 agentic 工作流能力。

BrowseComp：GPT-5.4 为82.7%，GPT-5.2 为65.8%。
Toolathlon：GPT-5.4 为54.6%，GPT-5.2 为45.7%。
MCP Atlas：GPT-5.4 为67.2%，GPT-5.2 为60.6%。

另外，OpenAI 还明确提到 GPT-5.4 支持tool search这一类机制：不是把全部工具定义都塞进上下文，而是需要时再检索工具定义。这对于工具很多的 Agent 系统，能减少上下文浪费，提升效率。

百万上下文

API 官方页面给出的 GPT-5.4 参数是：

上下文窗口：1,050,000 tokens
最大输出：128,000 tokens

价格方面：

gpt-5.4：输入$2.50 / 1M tokens，缓存输入$0.25 / 1M，输出$15 / 1M
gpt-5.4-pro：输入$30 / 1M，输出$180 / 1M

同时官方说明，当输入超过 272K tokens时，GPT-5.4 / GPT-5.4 Pro 会按更高费率计费。

GPT-5.4 与目前主流模型对比

和 GPT-5.3-Codex 比

更准确的说法不是“全面吊打”，而是：

代码主干能力已经接近甚至略强于 GPT-5.3-Codex
世界知识、业务理解、事实性、专业工作能力明显更完整
电脑操作与工具使用也更均衡

所以 GPT-5.4 的价值在于：它把 Codex 的工程腿补进了主线模型，但同时保留了通用模型该有的表达和知识能力。

和 Claude Opus 4.6 比

从官方可核对数据看：

在OSWorld上，GPT-5.475.0%，Claude Opus 4.672.7%。

但不能简单说“GPT-5.4 全面赢过 Claude”。更准确的结论是：
GPT-5.4 在 OpenAI 这次主打的专业工作、工具使用、电脑操作方向上非常强，而且价格比 GPT-5.4 Pro 友好得多；Claude 依然在部分工程体验和一些场景中有自己的优势。

和 Gemini 3.1 Pro 比

Gemini 3.1 Pro 的优势主要集中在科学推理和数学类benchmark。例如在 GPQA Diamond（博士级科学问题）：

GPT-5.4 Pro：94.4%
Gemini 3.1 Pro：约 94% 左右

两者基本处于同一水平。

而在 FrontierMath（高等数学），GPT-5.4 Pro 略强。

不过在一些浏览与信息搜索类任务（例如 BrowseComp）中，Gemini 系列模型也有不错表现。

综合对比

从整体 benchmark 分布来看，三家模型的能力结构逐渐分化：

GPT-5.4：Agent 执行能力最强（工具、电脑操作、工作任务）
Claude Opus 4.6：写作与复杂代码任务依然表现稳定
Gemini 3.1 Pro：科学推理和搜索类任务更突出

👉因此如果是 Agent 框架或自动化系统（例如 OpenClaw），GPT-5.4 目前是更均衡的基座模型选择。

GPT-5.4 特别适配 OpenClaw?

这一点可以直接从 OpenClaw 需要的“基座模型能力结构”来理解。

OpenClaw 这类 Agent/自动化框架，本质上最需要四件事：

要有稳定的代码能力

OpenClaw 要做任务编排、脚本执行、工具调用、页面操作、报错修复，底层离不开代码能力。GPT-5.4 在 SWE-Bench Pro 上57.7%，已经进入 GPT-5.3-Codex 这一档。

要有足够强的世界知识和业务理解

单纯会写代码，不代表能理解任务目标、业务语义、用户意图。GPT-5.4 在 GDPval、OfficeQA、投行建模这些更接近真实工作的基准上都显著强于 GPT-5.2，说明它更适合做“不是纯编程”的 Agent。

要能看、能用工具、能跨步骤执行

OpenClaw 的价值不只是“聊天”，而是执行。GPT-5.4 这次在OSWorld-Verified 75.0%、Toolathlon 54.6%、BrowseComp 82.7%的表现，说明它更适合作为执行型模型，而不只是回答型模型。

成本和上下文要扛得住

Agent 系统最怕两件事：太贵，以及上下文不够长。GPT-5.4 API 价格是＄2.5 / ＄15，上下文是1.05M，对于需要长任务链、长文档、长代码仓库的场景，比“高价旗舰但难大规模跑”的方案更容易落地。

👉GPT-5.4 把 GPT-5.3 Codex 的强代码能力、比 GPT-5.2 更全面的世界知识、更出色的工具使用能力，以及便宜到离谱的 Codex 额度集于一身——这四项优势合体，足以让它成为 OpenClaw 的完美天选基座模型。

如何使用到GPT-5.4呢？

面向群体有哪些？

即日起，GPT-5.4 向 ChatGPTGo、Plus、Team 和 Pro 等付费用户开放，替代 GPT-5.2 Thinking 成为默认思考模型，GPT-5.4 Pro 目前仅面向 Pro 和 Enterprise 计划开放

在 ChatGPT 中：

GPT-5.4 以GPT-5.4 Thinking的形式提供给付费用户。
Plus / Business用户手动选择 GPT-5.4 Thinking，额度为每周最多 3000 条消息。
Go用户启用 Thinking 后，额度是每 5 小时 10 条。

之后也会陆续在 API 和 Codex 上逐步推送，Codex可以直接更新切换模型

API的整体价格如下：

相比下看价格还是有所提升的，但已经比Claude便宜很多了，但性价比绝对比claude高的。

如何快速升级GPT5.4？

如果你有自己的GPT账号，但苦于没有虚拟卡、海外信用卡，也不知道找稳定的升级方法

那你可以通过我们的OpenAI 自助代充平台，完全不用找代充、也不用担心被骗，我们会全程提供质保售后服务，已稳定充值半年多了！！！

其他地区正规官方充值
支持24 小时自助升级
无需海外卡，两分钟搞定
低于0.01%封号率，包质保

直达入口👉：gptplus.uno
(复制到浏览器中打开)

👉不管你是充值Go、Plus、Pro，还是Business(team)，都可以在商城中找到（部分较高费用的将人工特殊处理）

OpenClaw如何切换到GPT5.4？

OpenClaw 现在是支持 OpenAI 的，而且分两种方式：

用 ChatGPT/Codex 登录（OAuth，走订阅额度）
用 OpenAI API Key（走 API 计费，或第三方平台）

直接切到 ChatGPT 授权，最直接的是跑 OpenClaw 的向导：

openclaw onboard

在向导里选 OpenAI Code (Codex) subscription / OpenAI Codex OAuth 这一类选项。OpenClaw 官方文档给的等价命令是：

openclaw onboard --auth-choice openai-codex

如果你已经装好了，只是想补登录，也可以用：

openclaw models auth login--provideropenai-codex

这一步会拉起浏览器，让你 Sign in with ChatGPT 完成授权。OpenAI 官方的 Codex 认证文档也确认：Codex 支持 Sign in with ChatGPT 和 API key 两种登录方式

如果你想一步到位，基本就是这套：

openclaw onboard --auth-choice openai-codex

浏览器里登录 ChatGPT 后，再把默认模型改成：

openai-codex/gpt-5.4

如果你是手改配置，就把agents.defaults.model.primary改成上面这个值。OpenClaw 官方模型文档说明，默认主模型就是在这个配置键里设的。

👉更简单的方法：在服务器上装个codex，把需要信息发给codex，让他帮你配置并切换到gpt-5.4，"手残党"福星！！！！

最后有话说

一句话总结：GPT-5.4 最重要的不是更强，而是更完整。它把 Agent 真正需要的几块能力，第一次比较像样地拼到了一起。

也正因为这种“完整度”的提升，它才不只是一个新模型，更像是 2026 年这一波 AI 从“会回答”继续往“会执行”推进时，一个很关键的节点。

可能2026年之前大家都在卷模型，而现在是卷Agent…

查看全文

http://www.jsqmd.com/news/490797/

Matplotlib绘制拆线图自定义曲线颜色显示

「OpenClaw 实战全攻略」：从打造 Second Brain 到服务器自愈，20+ 真实落地场景解析

欧洲十家运营商联手对抗星链：一场关于天空的“地缘保卫战”

第六讲：OpenClaw+Deepseek+飞书低成本安装龙虾指南（最新）

SceneV：基于Vue3与ThingsBoard的高性能低代码组态可视化解决方案

底部填充胶 (Underfill) 怎么选？AI 算力芯片与 CoWoS 先进封装导热用胶白皮书—37W/m·K 高导热与 13ppm 极低 CTE ：峻茂芯片级应力管理指南

高级java每日一道面试题-2025年8月27日-基础篇[LangChain4j]-如何审计 LLM 的输入输出？

2025_NIPS_Transformer brain encoders explain human high-level visual responses

Select、Poll、Epoll详解：核心区别与实战用法

coding plan vs token

高级java每日一道面试题-2025年8月28日-业务篇[LangChain4j]-如何使用 LangChain4j 实现智能投研助手？需要处理哪些金融数据源？

LeetCode Hot100（66/100）——118. 杨辉三角

Qt进程间通信

LeetCode Hot100（68/100）——198. 打家劫舍

【LLM进阶-Agent】13.function call vs mcp vs skills

2025_NIPS_EgoExoBench: A Benchmark for First- and Third-person View Video Understanding in MLLMs

告别绘图软件！Paperxie AI 科研绘图：10 次免费额度，让理工科论文可视化一步到位

Tower I3C Host Adapter 使用范例 (20)

【C++】左值引用、右值引用

CS二开之睡眠混淆（五）BeaconGate,UDRL,Sleepmask组合拳

AI新范式 02｜拆解世界模型：它是如何理解物理规律的？

WebRTC QoS方法之NetEQ在流量卡弱网应用下失效

Java基础-1

2025_NIPS_Scaling RL to Long Videos