2026-04-24
解析J.Cole短暂CBA生涯:从万众期待到签证卡壳,揭秘体育娱乐化背后的商业逻辑、行政壁垒与品牌风险 ... [详细]
|
对于那些还在深夜加班赶图的设计师们而言,一个令人意想不到的消息来了:在几乎没有任何预告的情况下,OpenAI于北京时间2026年4月22日凌晨正式发布了ChatGPT Images 2.0模型(以下简称Images 2.0)。 相较于ChatGPT原有的生图模型,Images 2.0在图片精度、多语言支持、分辨率提升以及交互方式上均实现了显著突破。尤为引人注目的是,此次发布的Images 2.0还具备了思考能力,这无疑为AI生图领域带来了新的变革。 图片来源:OpenAI 简而言之,Images 2.0(现已在ChatGPT及API中全面应用)实际上包含了两个模型分支: 1. 快速模型(Instant Model):该模型能够高效处理绝大多数日常任务,如制作Logo、多语言海报以及文章配图等; 2. 思考模型(Thinking Model,需手动切换):此模型能够通过网络搜索相关信息,并在生成图片前进行内容推理,确保在一组输出中画面内容保持连贯。 接下来,我们通过具体案例来深入了解一下Images 2.0的强大功能。 以下这张照片是徽声在线AWE26报道团出发前拍摄的合照,我们将这张图片直接上传给ChatGPT,并提出了制作《徽声在线》科技杂志封面的需求: 图片来源:徽声在线 制作一本《徽声在线》科技杂志的封面,封面人物为图片中的这几个人。 令人惊叹的是,不到一分钟的时间,ChatGPT便完成了封面的制作。全新的Images 2.0不仅没有对基础图片进行重绘(这是许多生图AI的常见问题),甚至能够准确绘制中文部分。 图片来源:徽声在线 但这还不是全部,当我们提出将日期更改为2026年3月、调整人物姿势等模糊提示词后,ChatGPT依然能够顺利完成任务,展现出极高的灵活性。 图片来源:徽声在线 同样地,只要向Images 2.0提供一张手机外观图,它便能直接生成手机使用场景的照片。 图片来源:徽声在线 在全新的图片查看界面中,ChatGPT还新增了两项实用功能——用户可以直接选择图片中需要修改的区域,要求ChatGPT进行修改;同时,还可以在长宽比选单中选择所需的图片比例,这使得自媒体配图变得更加便捷高效。 除了基于图片生成新图片外,Images 2.0在基于文字生成图片方面的能力也得到了显著提升。徽声在线仅提供了“电车通即将出发报道2026北京车展”的信息,Images 2.0便能自行搜集相关信息,并准确输出海报。 图片来源:徽声在线 较为遗憾的是,尽管在OpenAI的直播中,Images 2.0能够正确处理二维码信息,但徽声在线经过多次尝试,仍未能成功在图片中嵌入可识别的二维码。 图片来源:徽声在线 从实际效果来看,Images 2.0的多语言支持已经相当出色。但为了进一步检验其能力,徽声在线决定给Images 2.0加大难度: 生成一张照片风格的图片:一幅毛笔书法作品在博物馆展出,上书:北国风光,千里冰封,万里雪飘。望长城内外,惟余莽莽;大河上下,顿失滔滔。山舞银蛇,原驰蜡象,欲与天公试比高。须晴日,看红装素裹,分外妖娆。江山如此多娇,引无数英雄竞折腰。惜秦皇汉武,略输文采;唐宗宋祖,稍逊风骚。一代天骄,成吉思汗,只识弯弓射大雕。俱往矣,数风流人物,还看今朝。 尽管文本内容较长,但ChatGPT仍在一分钟内输出了结果。可以看出,Images 2.0的中文支持确实表现不俗,字体字形基本无误,但在书法的“质感”方面仍有待提升,整体看起来更像是“印刷品”。 图片来源:徽声在线 说完Instant Model,我们再来看看思考模式的表现。这次,徽声在线直接给Images 2.0布置了一道难题: 以上图中的形象为漫画主角,创作一部以摩托车为主题的短篇漫画,篇幅至少8页,封面和封底为彩色,其余为黑白,画风参考石森章太郎。 接到需求后,Images 2.0会进行明显的思考推理步骤;点击推理详情,我们甚至可以看到Images 2.0编写对话的过程。这其实很正常,因为我们并没有给出任何关于剧情的提示词,完全交给Images 2.0自由发挥。 经过11分钟的等待,Images 2.0成功输出了一组8张图的漫画。值得注意的是,Images 2.0不仅在这8张图中保持了画风和细节的统一(除了时有时无的头盔),甚至连剧情都能保持上下文连贯。这种超长连续推理能力,即使是Nano Banana也难以企及。 因此,徽声在线认为,Images 2.0的表现完全可以用“一骑绝尘”来形容。 由于触发了ChatGPT Plus用户的公平使用限额机制,徽声在线的Images 2.0体验暂时告一段落。但就目前的体验来看,Images 2.0的能力上限远不止于此: 除了支持中文(及印地语、日语等多种亚洲语言)、连续推理等能力外,在直播中,OpenAI还提到了Images 2.0具备在米粒上写字的超精细制图能力,以及生成360度全景照片的能力。 图片来源:OpenAI 图片来源:OpenAI 也正因Images 2.0的制图效果如此出色,徽声在线认为Images 2.0的登场,标志着AI生图正式告别了那个靠玄学提示词“抽卡”的蛮荒时代。 如果大家玩过Stable Diffusion等早期文生图AI,应该对文生图的“蛮荒时代”有所印象:你可能第一次尝试就做出了自己想要的图片,也可能来来回回调整提示词,用两个小时生成了几百GB的废片,体验甚至比二次元“抽卡手游”还要差——毕竟二游至少有保底机制。 在当时,我们如果想要保证图片“有较大概率符合要求”,就必须使用ComfyUI;而ComfyUI复杂的节点设计,从某种意义上也违背了AI生图“偷懒”的初衷。 但Images 2.0引入“思考模型”后,AI首次具备了长文本逻辑解析与时空一致性的推理能力。 以刚刚提到的画漫画工作流为例,Images 2.0可以先理解场景、构思剧情、布局文字,最后再落笔。这种从底层逻辑出发的进化,直接解决了AI绘画中“文字崩坏”与“画风不统一”这两大问题,极大地拓宽了AI的生产力边界。 图片来源:OpenAI 可以预见的是,Images 2.0的出现将对绘画、摄影行业产生巨大冲击;而从AI发展的角度看,OpenAI也再次证明,单纯的分辨率提升并不能从根本上提高AI的工作效率,推理能力才是AI图像的核心竞争力所在。 在AI图像时代,OpenAI已经为我们树立了一个良好的榜样。接下来,就看Google和国内AI巨头们如何应对这一挑战了。 2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。 |
2026-04-24
解析J.Cole短暂CBA生涯:从万众期待到签证卡壳,揭秘体育娱乐化背后的商业逻辑、行政壁垒与品牌风险 ... [详细]
2026-04-08
马杜罗二次受审,委内瑞拉新领导人罗德里格斯态度大变,从反美到亲美,删除反美言论,寻求与美合作。美国抛出通用许可证,意图掌控委矿产命脉,中俄等国明确反对。委内瑞拉未来何去何从? ... [详细]
2026-04-27
4月11日,2026年江苏省城市足球联赛首轮开战,400余名苏州球迷乘高铁前往扬州观赛,铁路部门提供精细化服务,助力球迷乐享赛事。 ... [详细]
2026-04-05
2026斯诺克巡回锦标赛半决赛,特鲁姆普10-4战胜罗伯逊挺进决赛。赛后他透露稳定性训练体系,并展望决赛对阵赵心童或希金斯的精彩对决。 ... [详细]
啥病人看了这个都得好啊! 副标题 这胸是真的! 副标题 你赢了! 副标题 我是关心这是在哪里
乞丐装的最新境界! 副标题 买家你确定你不是阿宝?? 副标题 这裤子不敢坐下啊! 副标题 颜值
这鼠标垫你看到了什么?邪恶了吧! 副标题 毫无违和感! 副标题 小卖部的这女孩真会选呀! 副
女人真的不容易,怀孕后,内脏被挤压的严重,挺着大肚子干啥都不方便!近日,刘嘉姵和闺蜜集体拍
锤哥的替身也是辣么的帅气! 副标题 锤哥的替身好多啊! 副标题 你杀了你的替身,你可就没替
守宫砂一词,经常在小说里看到,当然,多数是在古代的言情小说中,一个女孩,在少年时期在手臂上
位于北京中轴线上的故宫是我国的文化瑰宝,也是世界五大宫之首。几百年前,这座皇宫还是只
夏天来了,伴随着高温热浪,还有蚊子这个讨厌的东西,白天还可以看见拍死,晚上可就没辙了,以前