当前位置：首页 > news >正文

没有发布会，GPT Image 1.5 凌晨发布，实测与Nano Banana2相比，各有优势，但也一言难尽... - 详解

news 2026/6/30 16:25:44

OpenAI 急了。上周才刚推 GPT-5.2，这周又端上了新的图像模型。

GPT Image 1 的升级版。就是就在今天凌晨2点多，OpenAI 发布了 GPT Image 1.5——也就

按官方说法，新模型速度快了 4 倍、编辑更精确，而且 API 价格还下调了 20%。

看名字，更像是过渡模型，连发布会都没开，只是在x上发布公告，如果提升真的很大，那应该叫GPT Image 2。

话不多说，来看看有哪些改进，以及实测效果如何。

二、GPT Image 1.5 核心升级

2.1 速度提升：4 倍加速

指标	GPT Image 1	GPT Image 1.5
生成速度	~60秒	~15秒
提升幅度	-	4x

旧版模型动辄需要 1 分钟才能生成图片，新版的速度提升是实打实的改进。

2.2 精准编辑：核心卖点

这是 GPT Image 1.5 主打的能力——你让它改哪里，它就只改哪里。

具体表现：

光线一致性保持
构图稳定不变形
人脸特征多轮编辑后依然一致
Logo 和品牌元素精准保留

这解决了 AI 图像编辑长期以来的痛点：改一处、崩全图。

2.3 文字渲染能力增强

GPT Image 1 的文字能力只能说「勉强能用」，1.5 版本有明显进步：

支持更小、更密集的文字
适合生成信息图表、报纸版式等场景
可渲染完整的 Markdown 表格和多段落文章

但需要注意：英文表现优秀，中文渲染仍有差距。

2.4 API 价格下调

图像输入和输出，都比之前降价了20%，也算是利好开发者的一个消息

GPT Image 1.5 与 Nano Banana2实测对比

看到新的生图模型，不免都会跟生图王者Nano Banana2进行一番对比，那实测效果如何呢？

示例1

Prompt: 一张复古宝丽来风格的照片，带有标志性的白边框，平铺在一个深棕色纹理表面上。照片内是伊隆·马斯克（Elon Musk）和山姆·奥特曼（Sam Altman）的合影。两人都戴着红白相间的圣诞帽。马斯克在左侧，穿着黑色皮夹克，面带微笑。奥特曼在右侧，穿着棕色纽扣衬衫，微笑着举起一瓶复古玻璃瓶装的可口可乐，瓶身上有经典的红色标签。背景是一个光线昏暗的酒吧，背景有模糊的酒架、灯串和暖色调的灯光。照片表面有颗粒感和轻微的划痕。

GPT Image 1.5：

Nano Banana Pro：

人物生图这里，我更喜欢GPT Image 1.5的，完全根据我的Prompt来生成图片，氛围色彩都很到位，而Nano Banana上，仔细一看，你会发现照片表面并没有按照我说的一样，没有颗粒感和轻微的划痕。在指令遵循这方面，GPT Image 1.5略胜一筹。

示例2

Prompt：
做一个6列6行的网格图，内容如下：
第1行：希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙
第2行：螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封
第3行：邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z
第4行：马桶、地铁代币、静音图标、香水、蜻蜓、滑板头盔
第5行：蓝牙图标、数字13、绿色的心、魔方、加拿大鹅、士兵头盔
第6行：白狗、救生衣、绳结、键盘、纸巾盒、数字14

GPT Image 1.5：

Nano Banana Pro：

6x6网格图生成，从质感、写实等方面来看，gpt都不如banana的，甚至有一些还生成错了，比如第5行的加拿大鹅，gpt是直接给我生成了加拿大的国旗。在未输入明确提示词的前提下，banana会优先以写实为主。

示例3

Prompt：做一个1970年代伦敦切尔西的街景，要那种照片级的写实，全焦，纤毫毕现。街上人山人海，还要有一辆公交车，车上有个广告写着「ImageGen 1.5」，再加上OpenAI的标题和副标题「Create what you imagine」。整体风格要超写实的业余摄影，就像iPhone随手拍出来似的…

GPT Image 1.5：

Nano Banana Pro：

从人群中随手拍的一张照片，除了logo不太对以外没啥太多不适。就是 GPT Image 1.5指令遵循很到位，很"随手拍"，该有的都有，要素也都齐全，远处的英国国旗，行人不自觉地看向镜头，让人感觉就像

业余摄影随手拍出来的，没有严格按照提示词来生成。就是而反观banana这边，太全面了，各方面都想到了，连logo、公交侧面广告都想到了，不过整体照片就不像

示例4

Prompt：做一张深海生物的海报，要展示不同深度的，图片为一个竖着的海洋剖面图，整体风格精细有趣，日系动漫风，中文解析

GPT Image 1.5：

Nano Banana Pro：

深海生物海报，不管是从中文文字渲染上，还是从数据全面性来看，Banana完全碾压GPT Image 1.5，不过风格上还是gpt更符合日系动漫风一些。

实测总结

这次GPT Image 1.5在精准编辑和指令遵循上确实追上来了，但奈何有一个强大的对手：Nano Banana，所以很多方面都还有提高的空间。

作为中文用户，若是你是要生成包含中文、并且更有创意性的图片的话，首选Nona Banana，倘若需要严格按照指令遵循的可以选择GPT Image 1.5。

整体来看，真要说GPT Image 1.5 和 Nano Banana Pro，到底谁更强？

毋庸置疑，目前仍然是：Nano Banana Pro，很多方面即使你不说，banana也会帮你想好，中文文字渲染、创意性、全能型拉满。

怎么使用到GPT Image 1.5呢

GPT Image 1.5已在ChatGPT中向Plus、Pro和Team用户开放，免费版也可利用，不过次数有限

打开 ChatGPT，现在侧边栏多了一个「Images」的入口。

点进去就是专门的画图空间，有预设滤镜和热门提示词，不用自己想提示词。

不需要切换，平台默认就是 GPT Image 1.5。

若是你还在为怎么如何敏捷升级苦恼的话，可以…

更多内容请前往原文查看

http://www.jsqmd.com/news/297550/

相关文章：

语音情感识别入门指南，Emotion2Vec+镜像开箱即用

手把手教你安装verl并验证是否成功（附截图）

5分钟上手CAM++语音识别系统，科哥镜像让说话人验证超简单

Multisim14.2安装教程：如何绕过常见权限问题（操作指南）

零基础入门大模型！Qwen3-1.7B微调保姆级教程

亲测有效！Qwen-Image-Layered让图片编辑像搭积木一样简单

显存不足怎么办？Live Avatar低配运行解决方案

基于Python的轻量级上位机开发：快速理解流程

传统数据驱动时序建模 vs 3M 机制对齐建模

批量执行任务：Open-AutoGLM进阶使用技巧

时间戳命名防覆盖：每次输出结果独立保存

多表环境下触发器的创建和使用统一审计策略：实践分享

手写文字检测挑战：试试这个OCR模型的效果如何

CCS使用深度剖析：内存映射与CMD文件配置技巧

小白也能做动漫头像：UNet人像卡通化实战体验

5分钟部署PyTorch开发环境，PyTorch-2.x-Universal-Dev-v1.0真香

CAPL快速入门：结合Panel实现用户交互控制

完整流程曝光：我是如何三天学会微调大模型的

Qwen-Image-Layered性能优化技巧，提速3倍实测

零配置部署Qwen3-Embedding-0.6B，sglang一键启动

高级设置怎么用？UNet镜像环境检测全知道

工业自动化中lcd显示屏多语言显示实现教程

导师推荐10个一键生成论文工具，专科生毕业论文必备！

Using ES6 Module In Browser.

不只是开箱即用：麦橘超然还能这样深度定制

深度剖析x64dbg下载常见问题与解决

nmodbus4类库使用教程：零基础入门Modbus协议交互流程

自动驾驶感知入门，用YOLOE识别道路元素

亲测有效：用fft npainting lama轻松去除照片中多余物体

Unsloth避坑指南：新手常见问题全解答