当前位置: 首页 > news >正文

没有发布会,GPT Image 1.5 凌晨发布,实测与Nano Banana2相比,各有优势,但也一言难尽... - 详解

OpenAI 急了。上周才刚推 GPT-5.2,这周又端上了新的图像模型。

GPT Image 1 的升级版。就是就在今天凌晨2点多,OpenAI 发布了 GPT Image 1.5——也就

按官方说法,新模型速度快了 4 倍、编辑更精确,而且 API 价格还下调了 20%。

看名字,更像是过渡模型,连发布会都没开,只是在x上发布公告,如果提升真的很大,那应该叫GPT Image 2。

话不多说,来看看有哪些改进,以及实测效果如何。

二、GPT Image 1.5 核心升级

2.1 速度提升:4 倍加速

指标GPT Image 1GPT Image 1.5
生成速度~60秒~15秒
提升幅度-4x

旧版模型动辄需要 1 分钟才能生成图片,新版的速度提升是实打实的改进。

2.2 精准编辑:核心卖点

这是 GPT Image 1.5 主打的能力——你让它改哪里,它就只改哪里

具体表现:

  • 光线一致性保持
  • 构图稳定不变形
  • 人脸特征多轮编辑后依然一致
  • Logo 和品牌元素精准保留

这解决了 AI 图像编辑长期以来的痛点:改一处、崩全图。

2.3 文字渲染能力增强

GPT Image 1 的文字能力只能说「勉强能用」,1.5 版本有明显进步:

但需要注意:英文表现优秀,中文渲染仍有差距。

2.4 API 价格下调

图像输入和输出,都比之前降价了20%,也算是利好开发者的一个消息

GPT Image 1.5 与 Nano Banana2实测对比

看到新的生图模型,不免都会跟生图王者Nano Banana2进行一番对比,那实测效果如何呢?

示例1

Prompt: 一张复古宝丽来风格的照片,带有标志性的白边框,平铺在一个深棕色纹理表面上。照片内是伊隆·马斯克(Elon Musk)和山姆·奥特曼(Sam Altman)的合影。两人都戴着红白相间的圣诞帽。马斯克在左侧,穿着黑色皮夹克,面带微笑。奥特曼在右侧,穿着棕色纽扣衬衫,微笑着举起一瓶复古玻璃瓶装的可口可乐,瓶身上有经典的红色标签。背景是一个光线昏暗的酒吧,背景有模糊的酒架、灯串和暖色调的灯光。照片表面有颗粒感和轻微的划痕。

GPT Image 1.5:

Nano Banana Pro:

人物生图这里,我更喜欢GPT Image 1.5的,完全根据我的Prompt来生成图片,氛围色彩都很到位,而Nano Banana上,仔细一看,你会发现照片表面并没有按照我说的一样,没有颗粒感和轻微的划痕。在指令遵循这方面,GPT Image 1.5略胜一筹。

示例2

Prompt:

做一个6列6行的网格图,内容如下:

第1行:希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙

第2行:螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封

第3行:邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z

第4行:马桶、地铁代币、静音图标、香水、蜻蜓、滑板头盔

第5行:蓝牙图标、数字13、绿色的心、魔方、加拿大鹅、士兵头盔

第6行:白狗、救生衣、绳结、键盘、纸巾盒、数字14

GPT Image 1.5:

Nano Banana Pro:

6x6网格图生成,从质感、写实等方面来看,gpt都不如banana的,甚至有一些还生成错了,比如第5行的加拿大鹅,gpt是直接给我生成了加拿大的国旗。在未输入明确提示词的前提下,banana会优先以写实为主。

示例3

Prompt:做一个1970年代伦敦切尔西的街景,要那种照片级的写实,全焦,纤毫毕现。街上人山人海,还要有一辆公交车,车上有个广告写着「ImageGen 1.5」,再加上OpenAI的标题和副标题「Create what you imagine」。整体风格要超写实的业余摄影,就像iPhone随手拍出来似的…

GPT Image 1.5:

Nano Banana Pro:

从人群中随手拍的一张照片,除了logo不太对以外没啥太多不适。就是 GPT Image 1.5指令遵循很到位,很"随手拍",该有的都有,要素也都齐全,远处的英国国旗,行人不自觉地看向镜头,让人感觉就像

业余摄影随手拍出来的,没有严格按照提示词来生成。就是而反观banana这边,太全面了,各方面都想到了,连logo、公交侧面广告都想到了,不过整体照片就不像

示例4

Prompt:做一张深海生物的海报,要展示不同深度的,图片为一个竖着的海洋剖面图,整体风格精细有趣,日系动漫风,中文解析

GPT Image 1.5:

Nano Banana Pro:

深海生物海报,不管是从中文文字渲染上,还是从数据全面性来看,Banana完全碾压GPT Image 1.5,不过风格上还是gpt更符合日系动漫风一些。

实测总结

这次GPT Image 1.5在精准编辑和指令遵循上确实追上来了,但奈何有一个强大的对手:Nano Banana,所以很多方面都还有提高的空间。

作为中文用户,若是你是要生成包含中文、并且更有创意性的图片的话,首选Nona Banana,倘若需要严格按照指令遵循的可以选择GPT Image 1.5。

整体来看,真要说GPT Image 1.5 和 Nano Banana Pro,到底谁更强?

毋庸置疑,目前仍然是:Nano Banana Pro,很多方面即使你不说,banana也会帮你想好,中文文字渲染、创意性、全能型拉满。

怎么使用到GPT Image 1.5呢

GPT Image 1.5已在ChatGPT中向Plus、Pro和Team用户开放,免费版也可利用,不过次数有限

打开 ChatGPT,现在侧边栏多了一个「Images」的入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

不需要切换,平台默认就是 GPT Image 1.5。

若是你还在为怎么如何敏捷升级苦恼的话,可以…

更多内容请前往原文查看

http://www.jsqmd.com/news/297550/

相关文章:

  • 语音情感识别入门指南,Emotion2Vec+镜像开箱即用
  • 手把手教你安装verl并验证是否成功(附截图)
  • 5分钟上手CAM++语音识别系统,科哥镜像让说话人验证超简单
  • Multisim14.2安装教程:如何绕过常见权限问题(操作指南)
  • 零基础入门大模型!Qwen3-1.7B微调保姆级教程
  • 亲测有效!Qwen-Image-Layered让图片编辑像搭积木一样简单
  • 显存不足怎么办?Live Avatar低配运行解决方案
  • 基于Python的轻量级上位机开发:快速理解流程
  • 传统数据驱动时序建模 vs 3M 机制对齐建模
  • 批量执行任务:Open-AutoGLM进阶使用技巧
  • 时间戳命名防覆盖:每次输出结果独立保存
  • 多表环境下触发器的创建和使用统一审计策略:实践分享
  • 手写文字检测挑战:试试这个OCR模型的效果如何
  • CCS使用深度剖析:内存映射与CMD文件配置技巧
  • 小白也能做动漫头像:UNet人像卡通化实战体验
  • 5分钟部署PyTorch开发环境,PyTorch-2.x-Universal-Dev-v1.0真香
  • CAPL快速入门:结合Panel实现用户交互控制
  • 完整流程曝光:我是如何三天学会微调大模型的
  • Qwen-Image-Layered性能优化技巧,提速3倍实测
  • 零配置部署Qwen3-Embedding-0.6B,sglang一键启动
  • 高级设置怎么用?UNet镜像环境检测全知道
  • 工业自动化中lcd显示屏多语言显示实现教程
  • 导师推荐10个一键生成论文工具,专科生毕业论文必备!
  • Using ES6 Module In Browser.
  • 不只是开箱即用:麦橘超然还能这样深度定制
  • 深度剖析x64dbg下载常见问题与解决
  • nmodbus4类库使用教程:零基础入门Modbus协议交互流程
  • 自动驾驶感知入门,用YOLOE识别道路元素
  • 亲测有效:用fft npainting lama轻松去除照片中多余物体
  • Unsloth避坑指南:新手常见问题全解答