Google 推出 Gemini 2.5 Computer Use 模型
今年早些时候,Google 就宣布了将通过 Gemini API 为开发者带来直接操控电脑界面的 AI 能力。今天,Google 正式推出了 Gemini 2.5 Computer Use模型(Gemini 2.5 Computer Use model)。
这个专门的模型基于 Gemini 2.5 Pro 强大的视觉理解与推理能力构建,可以让 AI 智能体像人类一样,直接点击、滚动、输入文字,实现与网页或应用的交互。这一技术在多个网页和移动端界面的任务基准测试中,表现超越了当前领先的同类产品,而且反应速度更快。
开发者们现在就可以通过 Gemini API,在 Google AI Studio 和 Vertex AI 中提前体验。