扫码下载 APP
qrCode
更多下载方式
今天不再提醒

DeepMind 纪录片:通用 AI 比火电更伟大,人类文明将改写

DeepMind 纪录片《思考游戏》(The Thinking Game)免费公开,记录 Demis Hassabis 毕生追寻通用 AI(AGI)的旅程。Hassabis 认为,通用 AI 比电与火的出现更重要。他警告,AGI 即将诞生,将成为人类历史分水岭,“我们的下一代将生活在一个全新的世界,每一刻都是重要的”。

Demis Hassabis 的通用 AI 毕生使命

Dennis Hassabis

(来源:Youtube)

作为在六岁就在地方国际象棋比赛夺冠的剑桥大学高材生,Demis Hassabis 很早就把 AGI 研究当成一辈子的使命,因为他想解决一个困扰生物学界 50 年的问题:蛋白质折叠。现在我们可能很难想象,但当时有很多创投界及学术界的人,对通用 AI 技术抱持很大的质疑。前者认为 Demis 的想法像在画大饼,后者则认为把神经科学加机器学习结合,不是纯正的科学。

在 2010 年成立的 DeepMind,早期的募资之路可谓困难重重,直到他们遇到知名天使投资人彼得·蒂尔(Peter Thiel)。蒂尔虽然成为了 DeepMind 大金主,但他坚持要团队搬去硅谷。Demis 坚决留在伦敦,他认为这里有独特的人才库,且硅谷那种快速失败、快速转向的文化,不适合需要长期研究的通用 AI 技术。

这个决定凸显了 Hassabis 对 AGI 研究的深刻理解。通用 AI 不是一个可以快速迭代的消费级产品,而是需要基础科学突破的长期研究。硅谷的创业文化强调快速验证市场需求和商业模式,但 AGI 研究的价值可能在十年甚至数十年后才能显现。Hassabis 坚持留在伦敦,保护了 DeepMind 的研究纯度。

Hassabis 将 AGI 比作人类发现火,这个类比极具深意。火的发现使人类能够烹饪食物、取暖、照明和冶炼金属,从根本上改变了人类文明的发展轨迹。Hassabis 认为通用 AI 将具有同等甚至更大的影响力,因为它不仅是一种工具,更是一种能够自我学习和创造的智能。

从游戏到围棋:DQN 与 AlphaGo 的突破

DeepMind DQN模型玩Atari遊戲

(来源:DeepMind)

DeepMind 在伦敦成立后,聚集了一群梦想家。为了训练 AI,他们决定使用“游戏”作为实验场,因为游戏是完美的受控环境。他们把深度学习(Deep Learning)与强化学习(Reinforcement Learning)技术结合创造出 DQN 模型,并让 AI 玩雅达利(Atari)的乒乓球游戏,但不教它规则,只要求它要看像素并追求高分。

一开始,AI 连一颗球都接不到,让团队一度怀疑通用 AI 技术是否只是空想,但突然间,AI 开始得分了。然后他们让 AI 玩《打砖块》(Breakout)这款游戏。经过数百局训练后,AI 竟然自己学会了挖通侧边的墙壁,让球在砖块上方反弹的挖隧道策略。最重要的是,这是一个没有人类预设,由机器自己发现的最佳解答。

这证明,DeepMind 成功创造一种能够适应不同环境的通用学习系统,这在通用 AI 发展中是一个巨大的突破。这不仅仅是让机器学会玩游戏,而是证明了机器可以在没有人类指导的情况下,自主发现策略和解决方案。这种自主学习能力是通用 AI 的核心特征。

尽管机器学习技术突破,但算力却成为瓶颈。为了加速实现 AGI,DeepMind 最终同意被 Google 以约 4 亿英镑收购,但他们希望保持研究的独立性。有了 Google 的算力支持,DeepMind 将目光转向起源于中国的“围棋”,这曾被认为是 AI 难以攻克的圣杯。

于是,AlphaGo 诞生了,并跟世界上最强人类围棋手李世石展开对决。AlphaGo 下出了震惊世界的第 37 手,这一手被视为人类棋手几乎不可能会走出的原创步数,让人类意识到机器不只是很会算数学,还展现了创造力。李世石的落败震惊全球,尤其对中国而言就像是斯普特尼克危机(Sputnik moment),唤醒了全球对 AI 的重视,并引发了一场 AI 版的“太空竞赛”。

DeepMind 技术演进的四大里程碑

DQN 模型:结合深度学习和强化学习,AI 自主发现游戏策略

AlphaGo:击败人类围棋冠军,展现创造力和直觉

AlphaZero:完全摒弃人类知识,纯粹自我对弈学习

AlphaFold:解决蛋白质折叠问题,获诺贝尔化学奖

AlphaGo 虽然强大,但主要是依赖人类棋谱数据来学习。DeepMind 随后开发了 AlphaZero,这是一个更优雅的算法,完全摒弃人类知识,只通过自我对弈来学习下棋。AlphaZero 从零开始,在一天之内就精通了国际象棋、将棋和围棋,甚至展现出人类未曾见过的棋风,证明机器可以通过纯粹的经验,超越人类千年的智慧积累。

AlphaFold 解决蛋白质折叠获诺贝尔奖

游戏只是实验场,Demis 真正的野心一直是用 AI 解决科学难题,也就是开头提到的“蛋白质折叠”。蛋白质折叠长久以来被视为人类最大的生物谜团,如果人类能够预测蛋白质结构,就能加速药物开发、治疗疾病。为了测试 AI 在生物学领域的可能性,DeepMind 成立 AlphaFold 团队并参加 CASP(蛋白质结构预测竞赛)。

在 2018 年的 CASP13 中,AlphaFold 虽然赢了比赛,但准确度仍不足以让生物学家在实际研究中使用,这让团队感到挫折与谦卑,意识到科学问题比游戏复杂得多。不愿放弃的 Demis,在新冠疫情期间加倍投入研究 AlphaFold,组建了一支结合物理学知识与机器学习的突击队。在居家隔离的艰难环境下,他们日以继夜地工作。

最终,在 2020 年的 CASP14 中,AlphaFold 取得惊人成绩。科学界公认,蛋白质折叠问题已被实质性地解决。然后,DeepMind 做了一个大胆的决定。他们不把这份成就商业化,而是把超过 2 亿种蛋白质,几乎是地球上所有已知的蛋白质序列的预测结构免费公开,将科技的果实无偿普惠给生物界。Demis 与另一名研究人员 John Jumper 也因该创举,获得了 2024 年诺贝尔化学奖。

AGI 诞生倒数负责任管理刻不容缓

自大语言模型(LLM)聊天机器人 ChatGPT 问世以来,生成式 AI 在短短三年内,已经彻底改写人们对程序设计、创意工作的劳动分配。现在,基于 LLM 技术推出的 ChatGPT、Gemini、Grok 等 AI 产品,正让普通人也能深刻地体会到 AI 科技的冲击。而下一步,通用 AI 的时代即将来临,将成为人类历史的分水岭。

Demis 说,科技是中立的,但人类的使用方式会决定善恶。他曾要求 Google 承诺,绝对不能把 DeepMind 的技术用于军事监视,并强调不能抱持快速行动、打破常规的态度。因为他认为,AGI 技术太过强大,一旦失控,后果将不堪设想。

Hassabis 警告:“AGI 即将诞生,我们的下一代将生活在一个全新的世界。因为有了 AI,一切将截然不同。如果你想要负责任的管理 AI,那么每一刻都是重要的,我这辈子就是为了这一刻。”这种紧迫感反映了 DeepMind 团队对通用 AI 潜在风险的深刻认识。正如火可以用于烹饪也可以用于摧毁,通用 AI 可以解决人类面临的重大挑战,也可能带来前所未有的风险。

站在生成式 AI 应用爆发,迎向 AI 代理人(AI Agents)的关键时刻,现在或许是我们好好回顾通用 AI 发展历程,与思考未来的最佳时机点。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)