当前位置: 首页 > news >正文

没有发布会,GPT Image 1.5 凌晨发布,实测与Nano Banana2相比,各有优势,但也一言难尽...

OpenAI 急了。上周才刚推 GPT-5.2,这周又端上了新的图像模型。

就在今天凌晨2点多,OpenAI 发布了 GPT Image 1.5——也就是 GPT Image 1 的升级版。

按官方说法,新模型速度快了 4 倍、编辑更精确,而且 API 价格还下调了 20%。

看名字,更像是过渡模型,连发布会都没开,只是在x上发布公告,如果提升真的很大,那应该叫GPT Image 2。

话不多说,来看看有哪些改进,以及实测效果如何。

二、GPT Image 1.5 核心升级

2.1 速度提升:4 倍加速

指标GPT Image 1GPT Image 1.5
生成速度~60秒~15秒
提升幅度-4x

旧版模型动辄需要 1 分钟才能生成图片,新版的速度提升是实打实的改进。

2.2 精准编辑:核心卖点

这是 GPT Image 1.5 主打的能力——你让它改哪里,它就只改哪里

具体表现:

  • 光线一致性保持
  • 构图稳定不变形
  • 人脸特征多轮编辑后依然一致
  • Logo 和品牌元素精准保留

这解决了 AI 图像编辑长期以来的痛点:改一处、崩全图。

2.3 文字渲染能力增强

GPT Image 1 的文字能力只能说「勉强能用」,1.5 版本有明显进步:

  • 支持更小、更密集的文字
  • 适合生成信息图表、报纸版式等场景
  • 可渲染完整的 Markdown 表格和多段落文章

但需要注意:英文表现优秀,中文渲染仍有差距。

2.4 API 价格下调

图像输入和输出,都比之前降价了20%,也算是利好开发者的一个消息

GPT Image 1.5 与 Nano Banana2实测对比

看到新的生图模型,不免都会跟生图王者Nano Banana2进行一番对比,那实测效果如何呢?

示例1

Prompt: 一张复古宝丽来风格的照片,带有标志性的白边框,平铺在一个深棕色纹理表面上。照片内是伊隆·马斯克(Elon Musk)和山姆·奥特曼(Sam Altman)的合影。两人都戴着红白相间的圣诞帽。马斯克在左侧,穿着黑色皮夹克,面带微笑。奥特曼在右侧,穿着棕色纽扣衬衫,微笑着举起一瓶复古玻璃瓶装的可口可乐,瓶身上有经典的红色标签。背景是一个光线昏暗的酒吧,背景有模糊的酒架、灯串和暖色调的灯光。照片表面有颗粒感和轻微的划痕。

GPT Image 1.5:

Nano Banana Pro:

👉 人物生图这里,我更喜欢GPT Image 1.5的,完全根据我的Prompt来生成图片,氛围色彩都很到位,而Nano Banana上,仔细一看,你会发现照片表面并没有按照我说的一样,没有颗粒感和轻微的划痕。在指令遵循这方面,GPT Image 1.5略胜一筹。

示例2

Prompt:

做一个6列6行的网格图,内容如下:

第1行:希腊字母β、沙滩球、柠檬、机器人、鱼缸、青蛙

第2行:螳螂、名表、浴缸、墨镜、彩色蝴蝶、信封

第3行:邮票、相框、冒热气的饺子、单词miracle、双板滑雪板、字母Z

第4行:马桶、地铁代币、静音图标、香水、蜻蜓、滑板头盔

第5行:蓝牙图标、数字13、绿色的心、魔方、加拿大鹅、士兵头盔

第6行:白狗、救生衣、绳结、键盘、纸巾盒、数字14

GPT Image 1.5:

Nano Banana Pro:

👉 6x6网格图生成,从质感、写实等方面来看,gpt都不如banana的,甚至有一些还生成错了,比如第5行的加拿大鹅,gpt是直接给我生成了加拿大的国旗。在未输入明确提示词的前提下,banana会优先以写实为主。

示例3

Prompt:做一个1970年代伦敦切尔西的街景,要那种照片级的写实,全焦,纤毫毕现。街上人山人海,还要有一辆公交车,车上有个广告写着「ImageGen 1.5」,再加上OpenAI的标题和副标题「Create what you imagine」。整体风格要超写实的业余摄影,就像iPhone随手拍出来似的…

GPT Image 1.5:

Nano Banana Pro:

👉 GPT Image 1.5指令遵循很到位,很"随手拍",该有的都有,要素也都齐全,远处的英国国旗,行人不自觉地看向镜头,让人感觉就像是从人群中随手拍的一张照片,除了logo不太对以外没啥太多不适。

而反观banana这边,太全面了,各方面都想到了,连logo、公交侧面广告都想到了,不过整体照片就不像是业余摄影随手拍出来的,没有严格按照提示词来生成。

示例4

Prompt:做一张深海生物的海报,要展示不同深度的,图片为一个竖着的海洋剖面图,整体风格精细有趣,日系动漫风,中文解析

GPT Image 1.5:

Nano Banana Pro:

👉 深海生物海报,不管是从中文文字渲染上,还是从数据全面性来看,Banana完全碾压GPT Image 1.5,不过风格上还是gpt更符合日系动漫风一些。

实测总结

这次GPT Image 1.5在精准编辑和指令遵循上确实追上来了,但奈何有一个强大的对手:Nano Banana,所以很多方面都还有提高的空间。

作为中文用户,如果你是要生成包含中文、并且更有创意性的图片的话,首选Nona Banana,如果需要严格按照指令遵循的可以选择GPT Image 1.5。

整体来看,真要说GPT Image 1.5 和 Nano Banana Pro,到底谁更强?

毋庸置疑,目前仍然是:Nano Banana Pro,很多方面即使你不说,banana也会帮你想好,中文文字渲染、创意性、全能型拉满。

怎么使用到GPT Image 1.5呢

GPT Image 1.5已在ChatGPT中向Plus、Pro和Team用户开放,免费版也可使用,不过次数有限

打开 ChatGPT,现在侧边栏多了一个「Images」的入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

不需要切换,系统默认就是 GPT Image 1.5。

如果你还在为怎么如何快速升级苦恼的话,可以…

更多内容请前往原文查看

http://www.jsqmd.com/news/106857/

相关文章:

  • 收藏!大模型项目别瞎做,这样做才拿得到Offer
  • ZooKeeper:enableACL和requireClientSASLAuth
  • 基于单片机的煤气泄漏报警系统设计
  • Linux网络日志怎么查看?
  • 系统是 Legacy BIOS 启动,不是 UEFI
  • SpringBoot+vue养老院运营管理系统
  • Python大数据基于大数据技术的医疗数据分析与研究_c1o2u99y_hxj031--论文
  • Go语言中的切片
  • 基于单片机的防火防盗报警系统设计
  • 信息化、数字化、数智化的区别:300+大公司实战经验,看完不踩坑
  • 学历低学网络安全行吗?
  • MCU+AT,必将让位于OpenCPU【第五章】
  • AI时代核心竞争力:手写多智能体系统,不依赖LangChain/LlamaIndex
  • CordovaOpenHarmony费用统计与分析
  • 第十七篇:Day49-51 前端工程化进阶——从“手动”到“自动化”(对标职场“提效降本”需求)
  • Python大数据基于机器学习的农产品价格数据分析与预测的可视化系统的设计与实现_y602itt4_tn045--论文
  • 30岁前端的十字路口!兄弟们,还有其他选择吗?
  • Radm1n1ster DS
  • 【必藏】后端工程师转行AI大模型开发全攻略:从零基础到高薪工程师的技能路径与学习资料免费分享
  • 出口美国的电子电器产品需要做FCC认证吗?
  • Linux如何查看磁盘使用情况?
  • N-乙酰-D-半乳糖胺——引领靶向递送新时代的关键糖分子 CAS:1811-31-0
  • Python大数据基于机器学习的电商评论情感分析_6z73z1t1_论文
  • Java 的责任分层能力:为什么复杂系统里的问题,更容易被“放对位置”
  • 《国产数据库技术》学习心得:DM数据库实践之路
  • Python大数据基于深度学习的饮食计划推荐与交流分享平台_j6yqgmwm--论文
  • QM申报流程及要求
  • 第十八篇:Day52-54 前端跨端开发进阶——从“多端适配”到“跨端统一”(对标职场“全栈化”需求)
  • 数据集成怎么做才管用?这篇讲透了
  • Python大数据使用Vue.js构建的大数据分析与可视化系统_m1sf2x1m_c008