OpenAI 发布了 ChatGPT Images 2.0,图片生成能力全面升级,今天起对所有 ChatGPT 和 Codex 用户开放。
这次升级最直观的变化是"听得懂复杂指令了"。以前用 AI 生图,稍微复杂一点的构图就容易翻车,尤其是图里带文字、UI 界面、密集排版这些场景,基本靠运气。Images 2.0 在这些细节上进步明显,小字、图标、界面元素都能比较准确地渲染出来,分辨率最高支持 2K,宽高比从 3:1 到 1:3 都行,做横幅、海报、社交图片可以直接出成品。
另一个实用的提升是多语言文字生成。以前让 AI 在图里写中文、日文、阿拉伯文,错字乱码是常态。OpenAI 说 2.0 能生成语义连贯的非英文文本,做中文海报或多语言物料的人可以试试看实际效果如何。
最有意思的是"会思考的图片生成"。在 ChatGPT 里选择 thinking 模式后,Images 2.0 可以先联网搜索实时信息,一个提示词生成多张不同风格的图,还能自检输出结果,甚至能生成可扫描的二维码。这个能力目前限 Plus、Pro 和 Business 用户使用,Enterprise 还没上线。
底层模型 gpt-image-2 同步开放了 API 接口,知识截止到 2025 年 12 月。移动端用户需要更新到最新版本。
体验地址:https://t.co/x7pUHEXs6s