如何评价最新发布的 GPT-Image-2,有哪些亮点值得关注?
这两天朋友圈也被ChatGPT Images 2.0生成的图片刷屏了,有点像前不久seedance 2.0发布时的盛况,有的人大呼不再需要平面设计师、不再需要PS软件了,声音有点耳熟。
连夜在ChatGPT上体验了Images 2.0,测试用它生成“中国朝代表介绍图”、“奔驰大G零部件拆解图”、“杂志封面-故宫建筑艺术”,效果出乎意料的好,是那种一键出片、无需修饰的好。
实话实说,Images 2.0强在你一眼看上去它生成的图片不像是AI做的,而是某个设计师、漫画家熬了几个通宵搞出来的东西。
之前的Nano banana也让我惊喜,特别是生成手办的真实度,但Images 2.0又向前走了一大截,突破了绘图AI的瓶颈,主要是以下三个点。
1、AI绘图第一次有了思考的能力,先想再画
Images 2.0在收到指令绘图前,会搜索网络资源,并进行逻辑推演,画好后自我检查纠正,保证了丰富度和准确性。
2、图像文本渲染精确度达到新高,完美支持中文
之前想要生成一张图文并茂的图像,尤其是中文等非拉丁字符,会出现乱码、无序、错别字等各种问题,更不要提排版了。但这次Images 2.0解决了这个问题,生成的图文效果不比10年经验的美工设计师差。
3、第一次实现规模化输出,且具备复杂系统可视化能力
用AI生成几百页的精美漫画在Images 2.0上成了现实,或者生成十几张房屋装修设计图,彼此关联且风格一致。
其次Images 2.0由于具备信息采集和推理能力,可以实现复杂系统的信息图展示,比如拆解一辆奔驰大G的零部件。
除此之外,Images 2.0图像精美度和真实感也更高,这个对比起来可能没那么突出,因为现在其他商业AI绘图应用也做的很好。
Sam Altman在Images 2.0的发布视频特意强调说,Images 2.0是图像生成的文艺复兴,智能化程度直接从gpt3跨越到gpt5,具备了生产级的效果。
从我的实测体验来看,他说的话没错。
有意思的是,这次发布会除了奥特曼之外,核心开发团队的四个人都是华人,我查了基本是在国内求学,从清北出去的CS背景,不得不感慨华人在AI技术领域强到可怕。
