Meta:買得起千億算力,留不住關鍵的人

PANews

撰文:Ada,深潮 TechFlow

庞若鸣在 Meta 的工位還沒坐熱,就走了。

2025 年 7 月,扎克伯格用一份總價超過 2 億美元的多年薪酬方案,從蘋果手中搶走了這位 AI 基礎設施領域最搶手的華人工程師。庞若鸣被安排進 Meta 超級智能實驗室,負責搭建下一代 AI 模型的基礎設施。

7 個月後,OpenAI 把他挖走了。

據 The Information 報導,OpenAI 對庞若鸣展開了長達數月的招募攻勢。儘管庞若鸣曾告訴同事“自己在 Meta 工作得非常愉快”,但最終還是選擇了離開。據彭博社報導,他在 Meta 的薪酬方案與里程碑掛鉤,提前離職意味著放棄大部分未兌現的股權。

2 億美元,買不了 7 個月的忠誠。

這不是一個簡單的跳槽故事。

一個人的離開,一群人的信號

庞若鸣不是第一個走的。

上週,Meta 超級智能實驗室開發者平台產品負責人 Mat Velloso 也宣布離職,此人去年 7 月從谷歌 DeepMind 離職加入 Meta,待了不到 8 個月。再往前推,2025 年 11 月,在 Meta 待了 12 年的圖靈獎得主、首席 AI 科學家 Yann LeCun 宣布離職創業,做他一直鼓吹的“世界模型”。Geoffrey Hinton 的核心弟子、Meta 生成式 AI 研究副總裁 Russ Salakhutdinov 也在近期官宣離開。

要理解 Meta AI 的人才流失,得先理解 Llama 4 到底有多傷。

2025 年 4 月,Meta 高調發布 Llama 4 系列的 Scout 和 Maverick 模型。官方的紙面數據堪稱華麗,聲稱在 MATH-500 和 GPQA Diamond 等核心基準測試(Benchmark)中,全面壓制了 GPT-4.5 和 Claude Sonnet 3.7。

然而,這款承載著 Meta 野心的旗艦模型,在開源社群的第三方獨立盲測中迅速“現了原形”,實際泛化與推理能力與宣傳出現了斷崖式落差。面對社群的強烈質疑,首席 AI 科學家 Yann LeCun 最終承認,團隊在測試階段“使用了不同的模型版本來跑不同的測試集,以優化最終得分”。

在嚴謹的 AI 學術界與工程界,這觸碰了不可饒恕的紅線。換句話說,團隊把 Llama 4 訓練成了一台只會做往年真題的“小鎮做題家”,而非真正擁有前沿智能的“優等生”。考數學就給你看數學卷王,考編程就給你看編程卷王,每個單項測試看起來都很強,但實際上這不是同一個模型。

這在 AI 學術界叫“摘櫻桃”,在應試教育界叫“替考”。

對一向以“開源燈塔”自居的 Meta 而言,這場風波直接摧毀了其在開發者生態中最寶貴的信任資產。它的直接代價是,扎克伯格對原有 GenAI 團隊的工程底線“徹底失去信心”,並由此拉開了後續空降高管、架空核心基建部門的序幕。

他花了 143 億到 150 億美元收購數據標註公司 Scale AI 49%的股份,把 28 歲的 Scale AI CEO Alexandr Wang 空降為 Meta 首席 AI 官,成立 Meta 超級智能實驗室(MSL)。圖靈獎得主 LeCun 在新架構中需要向這位 28 歲的年輕人匯報。10 月,Meta 裁撤 MSL 約 600 個崗位,包括 LeCun 一手創建的 FAIR 研究部門的成員。

而原計劃在 2025 年夏天發布的旗艦模型 Llama 4 Behemoth 也被一再推遲,從夏天推到秋天,最終無限期擱置。

Meta 轉而開發代號為“Avocado”的下一代文本模型和代號為“Mango”的圖像/視頻模型。据報導,Avocado 的目標是對標 GPT-5 和 Gemini 3 Ultra。原定 2025 年底交付,因為性能測試和訓練優化不達標,推遲到 2026 年第一季度。Meta 正在考慮將其閉源發布,放棄 Llama 系列一貫的開源傳統。

Meta 在 AI 模型上犯了兩個致命錯誤。第一是對 benchmark 造假,這直接摧毀了開發者社群的信任;第二是把 FAIR 這種需要十年磨一劍的基礎研究部門,硬塞進一個追求季度 KPI 的產品組織裡。這兩件事加起來,就是現在人才流失的根本原因。

自研晶片:另一條斷掉的腿

人才在跑,晶片也出了問題。

據 The Information 報導,Meta 上週砍掉了其內部正在開發的最先進 AI 訓練晶片項目。

Meta 的自研晶片計畫叫 MTIA(Meta Training and Inference Accelerator)。公司的初始路線圖雄心勃勃:MTIA v4 代號“Santa Barbara”、v5 代號“Olympus”、v6 代號“Universal Core”計畫在 2026 到 2028 年間陸續交付。其中 Olympus 被設計為 Meta 首款基於 2nm chiplet 架構的晶片,目標是同時覆蓋高端模型訓練和實時推理,最終取代英偉達在 Meta 訓練集群中的角色。

現在,這個最先進的訓練晶片被砍了。

Meta 並非沒有進展,MTIA 在推理端有了一些成果。代號“Iris”的 MTIA v3 推理晶片已經在 Meta 的資料中心大規模部署,主要用於 Facebook Reels 和 Instagram 的推薦系統,據稱降低了 40% 到 44%的總體擁有成本。但推理和訓練是兩回事。推理是跑模型,訓練是練模型。Meta 能自己做推理晶片,但造不出能跟英偉達正面剛的訓練晶片。

歷史上這不是第一次。2022 年,Meta 曾嘗試自研推理晶片,在小規模部署中失敗後直接放棄,轉頭給英偉達下了大單。

自研晶片受挫,直接加速了 Meta 的外購狂潮。

1350 億美元的恐慌性採購

2026 年 1 月,Meta 宣布今年的資本支出預算為 1150 億到 1350 億美元,幾乎是去年 722 億美元的兩倍。這筆錢的大頭,都要花在晶片上。

10 天之內,三筆大單接連落地:

2 月 17 日,Meta 與英偉達簽署多年期、跨代際戰略合作協議。Meta 將部署“數百萬顆”英偉達 Blackwell 和新一代 Vera Rubin GPU,外加 Grace 獨立 CPU。分析師估計交易規模在數百億美元級別,Meta 成為全球第一家大規模部署英偉達 Grace 獨立 CPU 的超算客戶。

2 月 24 日,Meta 與 AMD 簽署價值 600 億到 1000 億美元的多年期晶片協議。Meta 將採購 AMD 最新的 MI450 系列 GPU 和第六代 EPYC CPU。作為交易的一部分,AMD 向 Meta 發行了最多 1.6 億股普通股的認股權證,相當於 AMD 約 10%的股份,以每股 0.01 美元的價格,按交付里程碑分批歸屬。

2 月 26 日,據 The Information 報導,Meta 與谷歌簽署了一份價值數十億美元的多年期協議,租用谷歌雲的 TPU 晶片來訓練和運行其下一代大語言模型。同時,雙方還在討論 Meta 從 2027 年起直接購買 TPU 部署到自己的資料中心。

一家社交媒體公司,在 10 天內同時向三家晶片供應商下了可能總計超過千億美元的訂單。

這不是多元化布局。這是恐慌性採購。

算力焦慮的三層邏輯

Meta 為什麼這麼急?

第一,自研晶片指望不上了。最先進的訓練晶片項目被砍,意味著 Meta 在可預見的未來只能靠外購來滿足 AI 訓練需求。推理端的 MTIA 晶片能處理推薦系統這類成熟業務,但要訓練 Avocado 這種對標 GPT-5 的前沿模型,必須用英偉達或同等級別的硬體。

第二,競爭對手不會等。OpenAI 已經拿到了從微軟、軟銀到阿聯酋主權基金的海量資源。Anthropic 鎖定了谷歌和亞馬遜各 100 萬顆 TPU 和 Trainium 晶片的供應。谷歌 Gemini 3 完全在 TPU 上訓練完成。Meta 如果拿不到足夠的算力,連賽道的入場券都保不住。

第三,可能也是最根本的,扎克伯格需要用“購買力”來彌補“研發力”的不足。Llama 4 翻車、核心人才流失、自研晶片受挫,這三件事疊加在一起,讓 Meta 的 AI 敘事在華爾街面前變得脆弱。此刻簽下英偉達、AMD、谷歌三家的大單,至少釋放一個信號:我們有錢,我們在買,我們沒有放棄。

Meta 現在的策略就是,搞不定軟體就砸硬體,留不住人就買晶片。但 AI 競賽不是一個靠開支票就能贏的遊戲。算力是必要條件,不是充分條件。沒有頂級的模型團隊和清晰的技術路線,再多的晶片也只是倉庫裡的昂貴存貨。

買家的困境

回頭看 Meta 在 2 月份的三筆交易,一個有趣的細節被大多數人忽略了。

Meta 向英偉達買的是當前的 Blackwell 和未來的 Vera Rubin;與 AMD 的交易,買的是 MI450 和未來的 MI455X;向谷歌租的是當前的 Ironwood TPU,計畫明年直接購買。

三家供應商,三套完全不同的硬體架構和軟體生態。

這意味著 Meta 要在英偉達的 CUDA、AMD 的 ROCm 和谷歌的 XLA/JAX 三套截然不同的底層生態中反覆橫跳。多供應商策略固然能分散供應鏈風險、壓低硬體採購溢價,但這將帶來指數級飆升的工程複雜度。

這正是 Meta 當前最致命的軟肋,要讓一個萬億參數的模型在這三套底層程式模型完全不同硬體上都能高效訓練,需要的不只是懂 CUDA 的工程師,而是能從零搭建跨平台訓練框架的架構師。

這種人全世界可能不超過 100 個。庞若鸣是其中之一。

花 1000 億美元買進全球最複雜的硬體組合,同時卻在流失能駕馭這些硬體的大腦,這才是扎克伯格這場豪賭中最魔幻的畫面。

扎克伯格的賭局

把鏡頭拉遠一點看,扎克伯格在過去 18 個月對 AI 的操作路徑,和他當年 All In 元宇宙的節奏驚人地相似:

看到趨勢,重金投入,大舉招人,遇到挫折,策略急轉,再重金投入。

2021 到 2023 年是元宇宙,結果每年虧上百億,最後股價從 380 美元跌到 88 美元。2024 到 2026 年是 AI,同樣是不計代價地砸錢、頻繁的組織重組,同樣是「信我,我有 vision」的敘事。

不同的是,這次 AI 的風口確實比元宇宙實在得多。而 Meta 有錢燒,其廣告業務產生了充沛的現金流,2025 年第四季度 Meta 營收 599 億美元,同比增長 24%。

問題在於:錢能買到晶片,買到算力,甚至是工位上坐著的人,但買不到留下來的人。

庞若鸣選擇了 OpenAI,Russ Salakhutdinov 選擇了離開,LeCun 選擇了創業。

扎克伯格現在的賭注是,只要買到足夠多的晶片、建好足夠大的資料中心、花足夠多的錢,總能找到或者培養出能用這些資源的人。

這個賭注可能成立。Meta 毕竟是世界上最有錢的科技公司之一,超過 1000 億美元的經營現金流是它最堅固的護城河。从 OpenAI 到 Anthropic、从谷歌到其他競爭對手,Meta 都在持續挖人。据量子位報導,Meta 超級智能團隊 44 人中,近 40% 來自 OpenAI。

但 AI 競賽的殘酷之處在於,算力儲備、人才名單、模型表現都是公開的,Llama 4 的 benchmark 造假事件證明,在這個行業裡,你沒有辦法靠 PPT 和公關來維持領先。

市場最終只認一樣東西:你的模型夠不夠好。

食物鏈的位置

AI 軍備競賽進入 2026 年,食物鏈的排序已經初步清晰:

頂端是 OpenAI 和谷歌。OpenAI 有最強的模型、最大的用戶基數和最激進的融資。谷歌有自研晶片、自研模型以及自研雲基礎設施的完整垂直整合。Anthropic 緊隨其後,靠 Claude 模型的產品力和谷歌、亞馬遜的雙線算力供應,穩居第一梯隊。

Meta?它砸了最多的錢、簽了最多的晶片合約、做了最頻繁的組織重組,但到目前為止,還沒有拿出一個能讓市場信服的前沿模型。

Meta 的 AI 故事有點像 2005 年的雅虎。當時雅虎也是互聯網最有錢的公司之一,也在瘋狂收購和砸錢,但就是做不出谷歌那樣的搜尋引擎。錢不是萬能的。扎克伯格需要想清楚是,Meta 到底要在 AI 上做什麼,而不是看到什麼熱就買什麼。

當然,寫 Meta 的訃告還為時過早。35.8 億月活用戶、599 億美元的季度營收、全球最大的社交數據集,這些是任何競爭對手都難以複製的資產。

如果代號 Avocado 的下一代模型能在 2026 年如期交付並重返第一梯隊,扎克伯格所有的砸錢與重組都會被包裝成“力挽狂瀾的戰略魄力”。但如果再次不及預期,那這 1350 億美元換來的,將只是一座座通電發熱的矽晶圓倉庫。

畢竟,矽谷的 AI 軍備競賽從來不缺揮舞支票的超級買家。缺的是,知道如何用這些算力煉出未來的人。

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)