这文章太标题党了:“2026: This is AGI”
毕竟 AGI 没有明确定义,只要定义好 AGI,AGI 已经实现。
作者红杉两位合伙人 Pat Grady 和 Sonya Huang,投资人,看看就行了。
按他们的定义:AGI 就是能搞定事情的能力。
他们有一套框架来支撑。一个能搞定事情的人需要三样东西:知识储备、推理能力、试错迭代。对应到 AI,就是:预训练带来的知识(2022 年 ChatGPT)、推理时计算带来的思考能力(2024 年 o1)、长期代理带来的自主迭代(2026 年 Claude Code 等)。
三样凑齐了,就能自主工作几十分钟到几小时,自己发现错误、自己纠正、自己决定下一步做什么。
这 AGI 定义的有点草率了,不过我觉得他们举的例子还不错:
一个创始人需要招 DevRel(开发者关系负责人),给了一段模糊的要求:"技术够硬能让高级工程师服气,但又爱玩 Twitter,目标客户是平台团队,去找。"
传统做法是发个 JD、等简历、筛选面试。AI Agent 的做法完全不同。
它先在 LinkedIn 搜 Developer Advocate 和 DevRel,找到几百份简历。但职位头衔说明不了能力,于是它换了策略,去 YouTube 找技术演讲,筛出 50 多个演讲者,再按观看量和互动数据过滤。
然后交叉比对 Twitter。一半人账号不活跃或者只转发公司博客,排除。剩下十几个有真实粉丝、发真实观点、得到工程师互动的人。
再进一步缩小范围。看谁最近三个月发帖频率下降了,发帖变少有时意味着对现有工作不满。三个人浮出水面。
继续调查这三人。一个刚宣布入职新公司,一个自己创业刚融完资,都不会走。第三个在一家 Series D 公司做高级 DevRel,该公司刚裁了市场团队,她最近的演讲正好是关于平台工程的,有 1.4 万 Twitter 粉丝,发的梗图工程师爱看,LinkedIn 两个月没更新了。
Agent 写了封邮件,提到她最近的演讲、和创业公司业务的契合度、小团队能给的创作自由。建议聊聊,不是硬推销。
整个过程 31 分钟。创始人拿到的不是一堆简历,而是一个精准的候选人。
这个例子展示的不是高级搜索,而是自主决策。Agent 在信息不足时会换策略,在走进死胡同时会调头,在需要更多信号时会自己去找。这是以前的 AI 做不到的。
其实我们整天用 Coding Agent 写代码的早就认可了“AI 能搞定事情”,很多编程任务交给 Agent 都完成的不错,可以看到它从头到尾把一件事做完,有时候它卡住了还能尝试换一种方法自己解决。
但我觉得没几个人会认为 AGI 就这么简单,AI 依然受限于幻觉、上下文长度,但肉眼可见的变强是不争的事实。如果你还没试过 Claude Code、Codex 这样的 Agent,还是值得去尝试一下,找一个你熟悉的、有明确目标的任务,完整地交给 Agent 试试。别只是让它回答问题,让它从头到尾把一件事做完。观察它在哪里卡住、怎么尝试解决、最后结果怎么样。这是建立对 Agent 真实认知的最快方式。
点击图片查看原图