昨天提到,現在 AI 的繁榮,是資本+工程面大力出奇蹟的結果,LLM 在學術界眼中其實有很大的缺陷。
這種現象,還有一個更經典的案例:
其實人類並不真的完全理解為什麼飛機飛得起來。
你可能會想,這怎麼可能?
我們都能造出載著幾百人橫跨太平洋的波音 747 了,怎麼會不知道它為什麼能飛?
高中物理課我們學過一套說法,叫做「等時理論」。
這套理論說,因為機翼上方比較彎、路徑長,所以空氣為了要跟下方的空氣在末端「準時集合」,就得跑得快一點。
根據伯努利定律,流速快壓力就小,這就產生了升力。
但這個邏輯在物理上是完全錯誤的。
首先,沒有任何物理定律規定兩股空氣必須同時到達末端。事實上,實驗證明機翼上方的空氣不但跑得比較快,而且會比下方的空氣早得多抵達末端。
更打臉的是,很多特技飛機的機翼是上下完全對稱的對稱翼,甚至飛機能夠倒著飛,這完全打臉了「路徑長短決定速度」的說法。
如果你去問物理學家,你會陷入一場循環論證。
伯努利派說是因為壓力差,牛頓派說是因為機翼把空氣往下推的反作用力。
這就像是你問,是股價上漲帶動了投資人信心,還是投資人信心帶動了股價上漲?
在流體力學裡,這是一個互相糾纏的系統。你沒辦法單獨把其中一個拉出來當成絕對的因,它們是同時發生的。
這背後真正的終極大魔王,是納維-斯托克斯方程式。它是流體世界的牛頓第二定律,試圖描述每一滴水、每一絲風的動向。
但這個方程式有一個恐怖的特性:非線性。這意味著速度會影響它自己的加速度,導致混亂的湍流出現。
這個方程複雜到如果你能證明它的解在三維空間裡是平滑且存在的,你就能領到一百萬美元的千禧年大獎。到現在為止,沒人領到這筆錢。
而最讓科學家尷尬的地方在於,如果你用最純粹的物理方程式去算,不考慮摩擦力,飛機根本不會有升力。
空氣會繞過機翼末端捲回來抵消掉力量。為了讓飛機能飛,工程師必須在數學模型裡塞進一個作弊碼,叫「庫塔條件」。
庫塔條件的白話文版本就是:「我們強行規定空氣必須平滑地離開機翼末端。」
為什麼要這樣規定?因為我們觀察到現實中的飛機就是這樣飛的。沒有人從基礎物理推導出這條法則。
這就是最弔詭的地方。庫塔條件是一個基於觀察的「經驗法則」,而不是從第一原理推導出來的必然結果。
換句話說,我們在數學上可以精準預測升力,是因為我們強行加入了一個「因為它會飛,所以流體應該這樣動」的觀察結果。
科學家追求的是一條從原子、從分子的相互作用開始,一步步推導到波音 747 升空的完美邏輯鏈。
他們想要的是一個不需要任何假設、不需要任何「因為我看見它發生了所以它是對的」這種前提的純粹真理。
但這條路太難走了,走著走著,飛機都已經在天上飛了一百年,物理學家還在方程式的泥沼裡掙扎。
所以說,飛機之所以能飛,是工程師的勝利,科學界至今仍然不能完美解釋飛機的飛行原理。
這跟 LLM 是不是很像? 我們在 LLM 身上加了思維鏈,加了各種多模態,加了上下文工程。這些東西在科學家眼裡可能只是為了掩蓋缺陷而打的補丁,但在工程師手裡,這些補丁疊加在一起就成了奇蹟。
我們並沒有解決「智慧到底是什麼」這個本質問題,就像我們沒解決「升力的物理本質」一樣。我們只是找到了一套極其有效的手段,讓這架不像鳥的機器飛了起來。
---
庫塔條件被塞進方程式,到現在超過一百年了。
當初大家覺得這是權宜之計。等數學追上來,就能從第一原理解釋一切,到時候這個作弊碼就可以拿掉了。
結果一百年過去了,它還在那裡。飛機從螺旋槳換成噴射引擎,從幾個人坐到幾百個人坐,庫塔條件一直都在。
工程界並沒有等數學家算出答案,自己先捲起袖子開幹了。這種實用主義在一些有想法潔癖的人眼中可能不太乾淨,但人類文明的發展歷史,很多時候解法都髒髒的。
LLM 也一樣。我們可能永遠搞不清楚「智慧」到底是什麼。但這不妨礙有人已經用它蓋出東西來了。
時至今日,已經沒有人再去管飛機升空的物理原理了。我在想,會不會一百年後,LLM 還在,而 CoT 跟 RLHF 這種補丁就跟庫塔條件一樣,也沒人在乎了?