这篇文章可太有意思了,其实林俊旸本来可以在与邪恶巨头的对抗中全身而退留下美名,但这会这文章一发,整个人一下子全垮掉,完全被打回真实的原形,打个不太恰当的例子,有点姜萍成名后逢人就说自己发现了《主=6》新大陆的既视感,而其实顺着这个话题今天也来聊下有趣的大模型研发,下面简单说说:
一、先说说文章本身,评价是:平庸、乱、试图表达和证明自己
文章里里讨论的内容很多,但很乱,不成体系,也并非很有逻辑的结构性思考,更多的像是一个活在团队温床下茁壮成长的编程少年开始单干后,开始思考一些原本不属于他的专长板块的事务而多出来的奇思妙想。
文中的很多感悟,就像一个没有接受过专业软件架构训练、没有经历过复杂项目的解耦和重构历练的小孩子,突然开悟了一些“原本就存在的知识”,看到他这样,肯定既替他高兴,但也有点搞笑。他不发还好,发出来后,全篇都散发着阵阵无知的勇气。
大模型技术的推进过程,和大部分技术领域的发展演变是一致的,科学基础先行,一旦有可行性后,工程发展立即跟上,反复迭代、试错、重构,直至质变性的突破。
其实大模型相关算法,在过去的几十年里就已经陆续出现,甚至哪怕是Transformer的诞生,也并不是什么算法的突然发明,反而可以理解为是在算法领域的内部工程化突破,所以我们一直说,改变这个世界的,既有牛顿、爱因斯坦这样纯粹的科学神人,也必须依靠香农、冯诺依曼、特斯拉、沃森等等无数的工程先行者们,甚至在某种程度上,工程专家们对人类进步的贡献,和理论发明者是不相上下的。
而林俊旸作为享受时代红利的“新程序员”,其实离真正的那种,无论是顶尖纯数学算法研究员,还是卓越工程架构师,都很远很远,而“被动离职”的他,试图用这篇文章证明自己有思考、有能力、有理想,但很可惜,全篇只证明了一点:乱七八糟。超出他本职工作之外的内容,对他来说已经在大脑中堆成了逻辑和工程屎山。
这篇文章,一下子客观的把他从顶级AI开发者的圈子所剥离,掉入无尽的四五线鸡肋深渊(对,很残酷,二三线都轮不到他了),对他的影响是巨大的,如果我是团队Leader,我会从原本情绪驱动下的快速高薪聘请,转为认真审视这个人的真实水平并最终得出无法聘用的结论,或者说原本情绪化的定薪1亿年薪,转而冷静的就他的经验价值而给出一个合理的加码。这些转变,我想林俊旸本人肯定没想过那么多,但影响本身,后续一定会发酵。
当然了,今天写这篇文章肯定不是为了嘲讽林俊旸,因为基于这个案例,来探讨一下背后的真理,还是相当有意义和价值的。
二、顺着他这篇文章有价值的思考,是关于AI人才里特别有意思的结构性问题
1、Transformer本身,就是一种轻佻的、并不优雅的功利性架构,功利性架构最容易吸引到大量“次顶级”且“热情”的人才
先叠个甲,在这里并非否定功利性架构的能力和历史地位,甚至某种程度上,功利性架构也许也是各种事务发展过程中必然进化出的“伟大成果”,我们只是客观评述一些事实。
按照传统优雅架构设计的理念,更聪明的结构才能带来更强的结果,但在Transformer里,在结构通用、够用的情况下,是通过堆砌规模来实现了更强的结果,自此,形式美感无限下降。而绝对的天才,一般更相信绝对美丽的存在,所以这种天然的技术背德感,反而最终拿捏住了大量可以忍受道德落差的技术人员。
在Transformer的世界里,架构对齐本质这个至高追求不复存在,顺序、层级、方向依赖不复存在,强模块分工不复存在,不是先验的去理解结构,而是用数据和算力逼出结构,从符号到对象再到因果的执行逻辑也完全失效,一切token化,连续向量化,最后进行大规模模式拟合,整体看的话,甚至变成了一个统计学耦合机器人似的怪物。
不管造成的原因如何,但Transformer客观存在的一些特性,也解释了一个很有趣的问题,为什么众多传统编译器出身的绝对高智商上古Coding大神们,并没有在AI大模型领域继续有所建树,因为这不是他们的舒适区,不符合他们的工程洁癖和逻辑洁癖。
有没有似曾相识的感觉,哈哈哈,这就对上了,没错,PHP、Javascript、HTML,对,就是这样的味道。
PHP这样的快速脚本、低门槛语言,确实能收获大量似是而非、似懂非懂的技术人员,而林俊旸开心的发了长文,就和当年PHP架构师们一样,他们会在new features发布时兴奋不已,比如开心自己也打通了ORM,但其实JAVA、.NET阵营的老鸟们,早就在Hibernate和EF里,把ORM很香->ORM很重-ORM场景不适配->灵活ORM和SQL Builder这样的心路历程反复给踩烂了。又比如他们兴奋于自己在autoload上的巨大工程进步大吹特吹,但其实静态语言的世界里,早就有classpath、assembly loading、模块和包解析、编译期依赖检查,甚至IDE都早就进化到自动索引和跳转,根本不值一提。
再遥想当年,后来Git诞生了,GitHub上线,于是涌入了全世界的非科班技术爱好者,实话实说,我也是当时不屑的人群之一,我们习惯了传统架构师理念下的顺序、层级、方向依赖,我们习惯了完全可控的投入产出,我们更喜欢TFS、SVN这样的集权式代码管理,对于不可控的协作有天然的恐惧感,但不管如何,这无法阻挡的历史车轮,还是碾压了全世界的架构师,逼着和平庸对其,逼着从绝对的“逻辑美感和结果可控”转向DevOps这样的“过程优雅”。
此时此刻,恰如彼时彼刻!
当然了,结果我们看到了,原因呢,我真的不知道,请恕我浅薄的智力,暂时还无法理解Transformer这种结构会存在的必然性(我知道他必然存在,但还想不透彻为啥必然存在),因为这与数学和物理世界里一些莫名其妙但又神奇发生的范式转换实在太像了,他们在冥冥之中一定有我们还未能探究的深刻联系,我之前写过一篇文章谈到了GitHub奇迹,和Transformer一样,是典型的离散的、不可控的进入,却带来了确定性的离场,所以这宇宙啊,实在是太奇妙了!
2、大模型的研发领域,缺的不是人,而是资源,在2024-2026年,这是绝对资源驱动型的技术领域
所以,看明白了以上的时代和行业背景,你就会得出一个毋庸置疑无法辩驳的结论:
在近些年里,大模型研发,不缺人才,缺机器,谁有钱,谁有结果!
正是Transformer的结构使然,堆砌算力和规模就是其内禀的、系统性的驱动方向,所以这就是为啥虽然我虽然一直批评阿里掂量不清自己在ToC和ToB领域的能力差别从而导致在Qwen产品上产生了战略误判。但要论第一功臣,阿里胆大包天的买了小几万台H800、H100、H200、B200、B300,这才是最大的助推剂,马云才是本质上的原因,马云的执行力吴泳铭才是台前的英雄(虽然我很讨厌他,他并没有什么骨子里的AI信仰)!
所以非常客观的说,没有了林俊旸,还会张三李四王五等无数的研发人才,只要阿里的机器在,他们都能搞出Qwen来,所以这也是为啥,马斯克大手一挥就立刻搞出Grok,这也是为啥谷歌也能厚积薄发,稍微有点设备的公司,只要人才不太差,总能拿到结果!
而以上这些道理,想必林俊旸一定没太想明白。
而且更残酷的事情来了,进入2026年,新的范式又即将到来,那就是:
伟大的绝对智力的科班、传统的顶级架构师们,在大模型工程化军备竞赛开始白热化的时候,即将化身白衣骑士,来拯救这个领域的快而不专!
3、虽然大模型的新鲜蓝海带来了普适机会,但最终登顶的人,一定还是逻辑和工程大神!
接着继续说,你看,连林俊旸这样的四五线程序员,都开始有了工程的思考,有了架构的探索,这意味着整个2026年,会进入到全新的大模型研发争霸体系,具体可能的变化包括:
1)基本范式敲定后,顶级大神们开始下场,他们开始改造和拯救这群混乱的Transformer们。
2)基座大模型逐渐开源,研发门槛极具下降,会有越来越多的盛大EverMind这样的团队诞生,我们从不缺人才,而且,站在前任肩膀上的天才会更加厉害!
3)经过快1年的发展,AI(Vibe) Coding已经把补丁打得差不多了,离绝对的宏观可控就差最后几步,大模型研发的左脚踩右脚的自我迭代一定会在今年踏入历史的进程,这又是一个新的奇点时刻。
说到类似的类比,这不得不又一次把宇宙最伟大的安大神(Anders Hejlsberg)搬出来,一个功成名就的超顶级架构师,怀着对全人类的关怀之心,勇敢的站了出来,解救JS程序员们于水火之中,搞出TypeScript,TypeScript又顺其自然的推动了VS Code的诞生,至今服务着全世界几乎80%以上的开发者们,这简直就是最好的童话故事!
那么,大模型领域的安大神们会是谁呢,我们拭目以待,这会AI领域的代码实在太多了,多来一些科班架构师吧,让暴风雨般的变革喷发的更猛烈一些!
对了,再说个好玩的事,Claude的崛起,其实就是这新的研发争霸体系下的初步胜出者,绝对的科班工程师,厌倦了SAM的混乱技术管理,独立出来,必然可以快速的改掉类似林俊旸这样的快速开发者们的各种陋习,真正的架构师,永远致力于去达成更好的工程架构,追求更准确的研发方向,虽然阿迪王反华,但还是祝他好运吧,希望他能送我一个不封号的账户!