当前位置: 首页 > news >正文

OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

OpenAI 急了。

上周刚发布GPT-5.2,这周就来了图像模型。

几小时前,OpenAI 发布了GPT Image 1.5GPT Image 1的升级版。

借用官方的说法,新模型速度提升 4 倍,编辑更精准,API 价格还降了 20%。

但是,先别高兴太早。

从新模型的命名就能看出,它大概率还是个过渡模型。

如果真的提升很大,那何不直接叫GPT Image 2

谷歌从小香蕉(Nano Banana)到大香蕉,那可是直接升级成了Nano Banana Pro

而我后面的实测也证实了这个推测。


01|更新了什么?

核心改进:「精准编辑」。

你让它改哪里,它就改哪里,其他地方保持不变。

这是之前 AI 编辑图片最头疼的问题。

GPT Image 1.5号称解决了它。

光线、构图、人脸特征,都能在多轮编辑中保持一致。

速度也快了不少。

官方说是 4 倍。

实测确实如此,主要是那个旧版模型太慢了,动不动就 1 分钟才画出来。

文字渲染也有明显进步。

GPT Image 1的文字能力只能说是一般。

今天的GPT Image 1.5好了不少。

来自 OpenAI 官方的一个案例。

让模型生成一份报纸版式,里面是完整的 Markdown 表格和多段落文章。

字是清晰可读的。


02|怎么用这个新模型?

打开 ChatGPT,现在侧边栏多了一个「Images」入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

产品力这一块,OpenAI 没得说。

模型已经在全量推送,免费用户也能用。

不需要切换,系统默认就是GPT Image 1.5


03|和大香蕉比怎么样?

这是你们最关心的问题。

GPT Image 1.5Nano Banana Pro,到底谁更强?

先说结论:Nano Banana Pro,YYDS。

尤其是中文文字渲染,差距明显。

但 OpenAI 这次在精准编辑和指令遵循上确实追上来了。

文字渲染也还可以,仅限英文。

来实测。

A seamless, high-definition editorial quote card. Subject: A hyper-realistic portrait of {argument name="author" default="Steve Jobs"} on the left. The image is rendered in flawless native 4k resolution, with razor-sharp focus on the eyes and facial textures. His figure and black turtleneck smoothly fade into the dark brown background using a soft gradient. Atmosphere: Sophisticated deep espresso brown texture, warm premium lighting. Text Layout: On the open negative space to the right, display the quote "{argument name="famous_quote" default="Stay Hungry, Stay Foolish"}" in an elegant Light-Gold Serif font. Place the signature "—{argument name="author" default="Steve Jobs"}" below it. Decor: A single, massive, semi-transparent opening quotation mark ( “ ) is placed artistically in the background behind the text. It has low opacity, appearing as a subtle watermark that blends into the brown background.

GPT Image 1.5生成的效果如下。

整体还不错,背景质感挺好。

作为对比,这是我之前用 Lovart 里的Nano Banana Pro生成的。

接下来测试编辑能力。

把图中的 “Stay Hungry, Stay Foolish” 改成“求知若饥,虚心若愚”。

差距这就来了。

GPT Image 1.5的指令遵循没有太大问题。

但中文文字的渲染,一塌糊涂。

除了前面 3 个字,后面全是乱码。

Nano Banana Pro的结果。

继续。

把乔帮主的头偏移一个合适的角度,不需要正对。

GPT Image 1.5画的,只能说,略显僵硬。

来看Nano Banana Pro的。

你更喜欢哪个?


04|年底大战

最近是 AI 圈的密集发布期,堪比过年。

谷歌率先推出Gemini 3 ProNano Banana Pro

OpenAI 立即反击,发布GPT-5.2GPT Image 1.5

Anthropic 也没闲着,据说圣诞节前会推出Claude Sonnet 4.7

另外,本周应该还有个小惊喜,谷歌的Gemini 3 Flash

代言人 Logan Kilpatrick 昨天已经开始预热:⚡️⚡️⚡️。

期待一波。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

http://www.jsqmd.com/news/103090/

相关文章:

  • 15、Teradata RDBMS for UNIX:功能升级与特性解析
  • EmotiVoice语音合成在智能家居中的交互体验优化
  • 推广费,如何做账报税?
  • 83、由于提供的内容仅有“以下”二字,没有足够的信息来完成博客创作,请提供更详细的英文内容。
  • EmotiVoice能否实现方言情感语音合成?可行性分析
  • EmotiVoice语音合成在语音导航系统中的情感提示设计
  • 手把手教你训练自己的情感TTS模型——基于EmotiVoice
  • 84、量子点细胞自动机(QCA)处理器电路详解
  • EmotiVoice能否用于电话自动应答系统?稳定性验证
  • EmotiVoice语音韵律建模机制深入剖析
  • 11、使用 Asterisk 在 WRT54G 上实现 VoIP 功能
  • Java Web 公司资产网站系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • 16、常见Web安全问题及应对策略
  • 【毕业设计】SpringBoot+Vue+MySQL 供应商管理系统平台源码+数据库+论文+部署文档
  • 18、WRT54G路由器的硬件改造与故障修复指南
  • LobeChat可用性99.9%保障措施
  • 8、第三方固件OpenWrt与DD - WRT的配置、使用及安全设置
  • 78、请你提供书中第78章的具体内容,以便我按照要求为你创作博客。
  • 79、由于提供的内容仅“以下”二字,没有具体信息,无法按照要求生成博客,请你提供更详细的英文内容。
  • EmotiVoice语音能量与基频调控原理剖析
  • 80、由于没有提供第80章的具体英文内容,我无法为你完成博客创作,请你提供英文内容,以便我按照要求输出博客。
  • 1、Linksys WRT54G路由器:功能、历史与选购指南
  • CVE-2025-66165:merkulove Lottier for WPBakery插件中的授权缺失漏洞详解
  • 4、深入探索WRT54G第三方固件安装指南
  • 第1关:MIPS/RISC-V RegFile设计
  • 基于EmotiVoice的情感识别反馈闭环系统设想
  • 基于多智能体强化学习的轨道追逃博弈方法
  • 企业级语音系统搭建首选:EmotiVoice高可用架构设计
  • EmotiVoice语音合成在语音贺卡中的情感传递效果
  • 45、Unix 文件系统:属性与权限深度解析