Codex 已经可以支持 GPT-5.5 了,同时一口气推了五个能力升级,大方向是让 Codex 从“写代码的工具”变成“帮你干活的智能体”。
最大的变化是浏览器操控。Codex 现在可以直接操作网页应用,点击页面、填写表单、截图查看结果,然后根据看到的内容自己迭代,直到任务完成。比如你让它测一个注册流程,它能自己走完全程并告诉你哪一步有问题。
文档能力也升级了。Codex 现在能直接在 Microsoft Office 和 Google Drive 里生成电子表格、幻灯片和文档,质量比之前好不少。应用内还加了一个文件预览器,改完可以直接看效果、反复调整,不用来回切换。
电脑操控(Computer Use)跟着 GPT-5.5 一起增强,能看屏幕内容、点击、打字、在不同应用之间传递上下文。这个方向 Anthropic 去年率先推出,OpenAI 现在也跟上了。
比较有意思的是新增的“自动审查”(Auto-review)模式。以前 Codex 每走一步都要你点确认,现在它可以连续执行更长的任务链,遇到高风险操作时会启动一个独立的审查智能体来检查,通过了才继续。相当于自带了一个安全审计员,减少人工干预的同时控制风险。
另外,上周发布的图像生成模型 gpt-image-2 也整合进了 Codex,做应用原型、演示文稿的时候可以顺手生成配图,不用再切到别的工具。