当前位置: 首页 > news >正文

OpenAI发布GPT-5.3-Codex-Spark快速推理编程模型

OpenAI集团今日发布了其热门智能体编程工具GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。快速推理是指人工智能模型响应提示并采取行动的过程。

这款新模型名为GPT-5.3-Codex-Spark,是本月早些时候发布的原版GPT-5.3-Codex的精简版本。通过推出更加精简的版本,OpenAI借鉴了谷歌的策略,后者提供Gemini Flash系列大语言模型作为更快速、成本更低的替代方案,适用于不需要太多处理能力的应用场景。

OpenAI在博客文章中表示,GPT-5.3-Codex-Spark是首个运行在人工智能芯片制造商Cerebras Systems专用芯片上的模型。该公司上月与ChatGPT制造商建立了合作关系。两家公司宣布了一项价值超过100亿美元的多年协议,现在我们知道了原因。当时,OpenAI表示"将Cerebras整合到我们的计算解决方案组合中,完全是为了让我们的AI响应速度更快",而Spark已成为这一合作关系的"第一个里程碑"。

该公司解释说,Spark由Cerebras的Wafer Scale Engine 3芯片驱动,专为快速实时协作和快速迭代而设计。WSE-3芯片是Cerebras的第三代AI处理器。与该公司早期的芯片一样,这是一块巨大的、餐盘大小的硅片,拥有超过4万亿个晶体管。

除了芯片之外,Spark的另一个显著特点是它在"创造自己的过程中发挥了重要作用"。OpenAI的意思是,该模型的早期版本被用来帮助调试自己的训练过程、管理部署、诊断测试结果和进行评估。"我们的团队对Codex Spark能够加速自身开发的程度感到震惊,"该公司表示。

不仅仅是编程

GPT-5.3-Codex-Spark旨在成为"日常生产力驱动器",主要为快速原型开发而设计。这意味着它能够处理的不仅仅是基础编程任务。该公司解释说,它是一个AI智能体,几乎可以执行开发人员在计算机上可能做的所有事情。这包括"调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标等等",OpenAI表示。此外,该模型还强调能够在任务执行中途进行调整并提供频繁的状态更新。

在性能方面,OpenAI表示Spark的推理能力超越了完整版GPT-5.2-Codex模型和目前为ChatGPT提供支持的标准GPT-5.2模型。其输出生成速度平均快25%。此外,GPT-5.3-Codex-Spark在产生某些类型输出时,仅消耗早期模型约一半的"Token"。Token是AI模型处理和生成数据时使用的基本信息单位。

在Terminal-Bench 2.0基准测试中,GPT-5.3-Codex-Spark得分77.3%,相比GPT-5.2-Codex的64%准确率有所提升。OpenAI表示,该模型在游戏和网页开发方面也显示出类似的改进。

GPT-5.3-Codex-Spark目前仅向ChatGPT付费订阅用户开放,很快也将通过该公司的应用程序编程接口提供。与标准GPT-5.3-Codex模型相比,定价或用户限制没有变化。

"Codex-Spark是迈向双模式Codex的第一步:当你需要快速迭代时的实时协作模式,以及当你需要更深入推理和执行时的长时间运行任务模式,"OpenAI表示。该公司补充说,Cerebras的芯片在协助"需要极低延迟的工作流程"方面表现出色。

Cerebras已成为AI计算业务中英伟达最突出的竞争对手之一。上周,这家芯片制造商宣布在一轮融资中筹集了额外的10亿美元资金,使其估值达到230亿美元。这很可能是其最后一轮重大融资,因为该公司已提交了首次公开募股的文件,预计将在今年上半年进行。展望未来,这家芯片制造商期待与OpenAI展开更多合作。

"GPT-5.3-Codex-Spark最让我们兴奋的是与OpenAI和开发者社区合作,探索快速推理的可能性,"Cerebras联合创始人兼首席技术官Sean Lie表示。"新的交互模式、新的用例和根本不同的模型体验,而这次预览只是一个开始。"

Q&A

Q1:GPT-5.3-Codex-Spark与原版GPT-5.3-Codex有什么区别?

A:GPT-5.3-Codex-Spark是原版GPT-5.3-Codex的轻量化版本,专门针对快速推理进行优化。它的输出生成速度平均快25%,消耗的Token约为早期模型的一半,推理能力甚至超越了GPT-5.2-Codex模型。

Q2:GPT-5.3-Codex-Spark除了编程还能做什么?

A:该模型不仅能处理编程任务,还是一个全能的AI智能体,可以执行开发人员在计算机上的几乎所有工作,包括调试、部署、监控、编写PRD、编辑文案、用户研究、测试、指标分析等多种任务。

Q3:如何使用GPT-5.3-Codex-Spark?

A:目前GPT-5.3-Codex-Spark仅向ChatGPT付费订阅用户开放,很快也将通过OpenAI的应用程序编程接口提供。定价和用户限制与标准GPT-5.3-Codex模型相同,没有额外费用。

http://www.jsqmd.com/news/379075/

相关文章:

  • 2月13号
  • 波兰语AI安全守护神:SpeakLeash基金会推出Bielik Guard语言安全分类器 - 科技行者
  • Oracle Java授权变化引发用户大规模焦虑
  • 斯坦福与英伟达联合:AI训练为什么“炒冷饭“比“吃新鲜“更有效?
  • NVIDIA等联合推出PhyCritic:让AI学会像物理学家一样评判世界
  • 微软正式终止Exchange Web Services,2027年完全停用
  • JDK17_JDK21并发编程小白入门:资深架构常用模式+最佳实践
  • 互联网医疗系统导入PDF表格到富文本编辑器需几步?
  • StepFun团队Step 3.5 Flash:11B参数实现前沿智能水平
  • 教育平台富文本编辑器处理PDF注释是否完整保留?
  • Nebius团队推出智能化多目标强化学习新方法
  • 华威大学和牛津大学联手:让联邦学习也能拥有完美的数据“化妆师“
  • 跨平台CMS站群导入Word文档如何自动生成摘要?
  • JSP网页文件夹上传的详细步骤和示例代码是什么?
  • JSP上传文件夹时,如何进行加密处理?
  • 2026.2.13
  • 卫生高级职称考试哪个题库真题多?上岸考生实战推荐优质题库,高效备考 - 医考机构品牌测评专家
  • REGEXP函数是WPS表格或某些支持正则表达式的软件中的特有函数之一 - 指南
  • Note - 李超线段树
  • 融意网络:解决网站开发痛点,实现从需求到上线无忧托管,网络公司/APP开发/网站开发/小程序开发,网站开发团队排行榜 - 品牌推荐师
  • AI元人文:人工智能的自感与未来
  • AI元人文:人工智能的自感与未
  • 分类模型评估:关键指标与公平性实践
  • Spring事务全解析 - 实践
  • 如何查看我一共commit了多少个,是哪几个,如何回退到某一个版本
  • 工业场景A2A通讯协议
  • commit与fetch
  • 2月13日
  • Claude AI 发现 500 个高危软件漏洞
  • Anthropic承诺保护消费者免受电价上涨影响