掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

DeepMind 紀錄片:通用 AI 比火電更偉大,人類文明將改寫

DeepMind 紀錄片《思考遊戲》(The Thinking Game)免費公開,記錄 Demis Hassabis 畢生追尋通用 AI(AGI)的旅程。Hassabis 認為,通用 AI 比電與火的出現更重要。他警告,AGI 即將誕生,將成為人類歷史分水嶺,「我們的下一代將生活在一個全新的世界,每一刻都是重要的」。

Demis Hassabis 的通用 AI 畢生使命

Dennis Hassabis

(來源:Youtube)

作為在六歲就在地方西洋棋比賽奪冠的劍橋大學高材生,Demis Hassabis 很早就把 AGI 研究當成一輩子的使命,因為他想解決一個困擾生物學界 50 年的問題:蛋白質摺疊。現在我們可能很難想像,但當時有很多創投界及學術界的人,對通用 AI 技術抱持很大的質疑。前者認為 Demis 的想法像在畫大餅,後者則認為把神經科學加機器學習結合,不是純正的科學。

在 2010 年成立的 DeepMind,早期的募資之路可謂困難重重,直到他們遇到知名天使投資人彼得·提爾(Peter Thiel)。提爾雖然成為了 DeepMind 大金主,但他堅持要團隊搬去矽谷。Demis 堅決留在倫敦,他認為這裡有獨特的人才庫,且矽谷那種快速失敗、快速轉向的文化,不適合需要長期研究的通用 AI 技術。

這個決定凸顯了 Hassabis 對 AGI 研究的深刻理解。通用 AI 不是一個可以快速迭代的消費級產品,而是需要基礎科學突破的長期研究。矽谷的創業文化強調快速驗證市場需求和商業模式,但 AGI 研究的價值可能在十年甚至數十年後才能顯現。Hassabis 堅持留在倫敦,保護了 DeepMind 的研究純度。

Hassabis 將 AGI 比作人類發現火,這個類比極具深意。火的發現使人類能夠烹飪食物、取暖、照明和冶煉金屬,從根本上改變了人類文明的發展軌跡。Hassabis 認為通用 AI 將具有同等甚至更大的影響力,因為它不僅是一種工具,更是一種能夠自我學習和創造的智能。

從遊戲到圍棋:DQN 與 AlphaGo 的突破

DeepMind DQN模型玩Atari遊戲

(來源:DeepMind)

DeepMind 在倫敦成立後,聚集了一群夢想家。為了訓練 AI,他們決定使用「遊戲」作為實驗場,因為遊戲是完美的受控環境。他們把深度學習(Deep Learning)與強化學習(Reinforcement Learning)技術結合創造出 DQN 模型,並讓 AI 玩雅達利(Atari)的乒乓球遊戲,但不教它規則,只要求他要看像素並追求高分。

一開始,AI 連一顆球都接不到,讓團隊一度懷疑通用 AI 技術是否只是空想,但突然間,AI 開始得分了。然後他們讓 AI 玩《打磚塊》(Breakout)這款遊戲。經過數百局訓練後,AI 竟然自己學會了挖通側邊的牆壁,讓球在磚塊上方反彈的挖隧道策略。最重要的是,這是一個沒有人類預設、由機器自己發現的最佳解答。

這證明,DeepMind 成功創造一種能夠適應不同環境的通用學習系統,這在通用 AI 發展中是一個巨大的突破。這不僅僅是讓機器學會玩遊戲,而是證明了機器可以在沒有人類指導的情況下,自主發現策略和解決方案。這種自主學習能力是通用 AI 的核心特徵。

儘管機器學習技術突破,但算力卻成為瓶頸。為了加速實現 AGI,DeepMind 最終同意被 Google 以約 4 億英鎊收購,但他們希望保持研究的獨立性。有了 Google 的算力支持,DeepMind 將目光轉向起源於中國的「圍棋」,這曾被認為是 AI 難以攻克的聖杯。

於是,AlphaGo 誕生了,並跟世界上最強人類圍棋手李世石展開對決。AlphaGo 下出了震驚世界的第 37 手,這一手被視為人類棋手幾乎不可能會走出的原創步數,讓人類意識到機器不只是很會算數學,還展現了創造力。李世石的落敗震驚全球,尤其對中國而言就像是史普尼克危機(Sputnik moment),喚醒了全球對 AI 的重視,並引發了一場 AI 版的「太空競賽」。

DeepMind 技術演進的四大里程碑

DQN 模型:結合深度學習和強化學習,AI 自主發現遊戲策略

AlphaGo:擊敗人類圍棋冠軍,展現創造力和直覺

AlphaZero:完全摒棄人類知識,純粹自我對弈學習

AlphaFold:解決蛋白質摺疊問題,獲諾貝爾化學獎

AlphaGo 雖然強大,但主要是依賴人類棋譜數據來學習。DeepMind 隨後開發了 AlphaZero,這是一個更優雅的演算法,完全摒棄人類知識,只透過自我對弈來學習下棋。AlphaZero 從零開始,在一天之內就精通了西洋棋、將棋和圍棋,甚至展現出人類未曾見過的棋風,證明機器可以通過純粹的經驗,超越人類千年的智慧積累。

AlphaFold 解決蛋白質摺疊獲諾貝爾獎

遊戲只是實驗場,Demis 真正的野心一直是用 AI 解決科學難題,也就是開頭提到的「蛋白質摺疊」。蛋白質摺疊長久以來被視為人類最大的生物謎團,如果人類能夠預測蛋白質結構,就能加速藥物開發、治療疾病。為了測試 AI 在生物學領域的可能性,DeepMind 成立 AlphaFold 團隊並參加 CASP(蛋白質結構預測競賽)。

在 2018 年的 CASP13 中,AlphaFold 雖然贏了比賽,但準確度仍不足以讓生物學家在實際研究中使用,這讓團隊感到挫折與謙卑,意識到科學問題比遊戲複雜得多。不願放棄的 Demis,在新冠疫情期間加倍投入研究 AlphaFold,組建了一支結合物理學知識與機器學習的突擊隊。在居家隔離的艱難環境下,他們日以繼夜地工作。

最終,在 2020 年的 CASP14 中,AlphaFold 取得驚人成績。科學界公認,蛋白質摺疊問題已被實質性的解決。然後,DeepMind 做了一個大膽的決定。他們不把這份成就商業化,而是把超過 2 億種蛋白質,幾乎是地球上所有已知的蛋白質序列的預測結構免費公開,將科技的果實無償普惠給生物界。Demis 與另一名研究人員 John Jumper 也因該創舉,獲得了 2024 年諾貝爾化學獎。

AGI 誕生倒數負責任管理刻不容緩

自大語言模型(LLM)聊天機器人 ChatGPT 問世以來,生成式 AI 在短短三年內,已經徹底改寫人們對程式設計、創意工作的勞動分配。現在,基於 LLM 技術推出的 ChatGPT、Gemini、Grok 等 AI 產品,正讓普通人也能深刻地體會到 AI 科技的衝擊。而下一步,通用 AI 的時代即將來臨,將成為人類歷史的分水嶺。

Demis 說,科技是中立的,但人類的使用方式會決定善惡。他曾要求 Google 承諾,絕對不能把 DeepMind 的技術用於軍事監視,並強調不能抱持快速行動、打破常規的態度。因為他認為,AGI 技術太過強大,一旦失控,後果將不堪設想。

Hassabis 警告:「AGI 即將誕生,我們的下一代將生活在一個全新的世界。因為有了 AI,一切將截然不同。如果你想要負責任的管理 AI,那麼每一刻都是重要的,我這輩子就是為了這一刻。」這種緊迫感反映了 DeepMind 團隊對通用 AI 潛在風險的深刻認識。正如火可以用於烹飪也可以用於摧毀,通用 AI 可以解決人類面臨的重大挑戰,也可能帶來前所未有的風險。

站在生成式 AI 應用爆發,迎向 AI 代理人(AI Agents)的關鍵時刻,現在或許是我們好好回顧通用 AI 發展歷程,與思考未來的最佳時機點。

此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
  • 熱門 Gate Fun查看更多
  • 市值:$3716.77持有人數:2
    0.71%
  • 市值:$3562.06持有人數:1
    0.00%
  • 市值:$3579.31持有人數:1
    0.00%
  • 市值:$3641.17持有人數:1
    0.59%
  • 市值:$3632.23持有人數:2
    0.04%
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)