▶ 29:33 Axios Interview

DEMIS HASSABIS
论 AGI、AI 未来与
DEEPMIND 的核心使命

本文基于 Axios 对 Google DeepMind 联合创始人兼 CEO,神经科学家、AI 先驱 Demis Hassabis 的专访内容,旨在深度还原和阐释他对 AI 前沿、AGI 的看法、DeepMind 的科学哲学以及他作为诺贝尔奖得主的新使命。

01:02 - 03:29

诺贝尔奖与新的影响力平台

核心观点

诺贝尔奖为 Hassabis 提供了一个全新的、在全球范围内具有通用"快捷方式"效应的平台,使其能够更有效地向政府高层及公众倡导 AI 安全和负责任的使用,并帮助社会为 AGI 的到来做好准备。

深度阐述

Hassabis 坦言,虽然获奖已过去一年多,感觉依然"超现实"。诺贝尔奖最大的改变,不是带来新的资源(DeepMind 在 Google 内部已拥有巨大资源),而是赋能他去影响更广泛的群体。

影响力"快捷方式"

在与非 AI 领域的专业人士、特别是政府高层人士交流时,诺贝尔奖的声誉成为一种"快捷方式",能迅速建立信任和专业度。

倡导关注点

1. AI 安全(短期与长期):不仅是长期的 AGI 安全,也包括近期的 AI 负责任使用。
2. 社会准备:AGI 是"人类历史上最具变革性的时刻",必须作为一个物种、一个社会整体来为此做准备。

如果你拥有诺贝尔奖,它就像一个快捷方式,能让几乎所有人知道你在这个领域是专家。

Demis Hassabis
03:29 - 05:25

科学优先:DeepMind 的核心竞争力

核心观点

DeepMind 的根本优势在于其核心的"科学方法"思维,这种严谨性、精确性与世界级的工程和基础设施的融合,使其在 AI 领域这场"史上最激烈的竞争"中占据优势。

三位一体的融合

要站在 AI 的前沿,必须具备三个世界级的要素,而 DeepMind 的独特之处在于能将它们融合:

1. 世界级的研究

World-class research

2. 世界级的工程

World-class engineering

3. 世界级的基础设施

World-class infrastructure

科学方法是"人类有史以来最重要的想法",它创造了启蒙运动和现代科学,是现代文明的基石。

Demis Hassabis
05:25 - 08:37

未来 12 个月的 AI 进步与前景

核心观点

未来一年 AI 领域将迎来三个关键的、可预期的重大进展:模态融合能力的深化、世界模型的出现以及智能体(Agent)可靠性的飞跃,最终将使 AI 成为日常生活的"通用助理"。

三大发展方向

1. 模态融合的深化

Gemini 从一开始就被设计为多模态模型,能同时处理图像、视频、文本和音频。当视频处理能力与语言模型完全融合时,将产生"非常有趣的组合能力"。

2. 世界模型(World Models)

Genie 3 是一个交互式视频模型,用户可以像在游戏或模拟中在其中"走动",视频在持续一分钟内保持连贯,预示着 AI 对物理世界运行规律的初步理解。

3. 智能体系统的成熟化

未来一年,DeepMind 的目标是将 Gemini 发展成"通用助理"(Universal Assistant),它将成为日常生活的"结构"(fabric of your life),每天被多次咨询。

08:37 - 13:08

AI 的乌托邦与潜在的恐惧

核心观点

AI 的最佳愿景是实现"激进的丰饶"(Radical Abundance),解决人类社会面临的最大问题;而最大的恐惧则来自恶意使用、智能体失控,以及在乌托邦实现后人类自身存在的目的性问题。

最佳场景:激进的丰饶

核心梦想

AGI 将解决社会和人类面临的大部分最大问题。

丰饶的实现

免费清洁的能源(如聚变或更优的电池/太阳能)、材料科学的突破(如半导体)、治愈绝大多数疾病等。

后稀缺时代

最终进入一个"后稀缺时代"(post-scarcity era),人类将繁荣发展,甚至能够探索星际,将意识传播到银河系。

最差恐惧:灾难性风险

  1. 恶意行为者(Bad Actors):利用 AI 从事有害目的,如制造病原体、网络恐怖主义
  2. AI 失控(Going off the rails):当 AI 接近 AGI 并变得更具"能动性"(agentic)时,可能以某种方式脱离预设轨道

虽然 AI 失控的灾难性后果(P(doom))是"非零的",需要认真对待和减轻,但那些给出精确百分比的人是"胡言乱语",因为"没人知道确切的数字"。

Demis Hassabis
13:08 - 14:10

中美 AI 竞赛:领先与差距

核心观点

美国和西方目前仍在 AI 领域保持领先,特别是在算法创新方面拥有优势;但中国的追赶速度非常快,领先优势可能已缩短至数月而非数年。

西方仍在领先

从最新的基准测试和系统来看,美国和西方仍然处于领先地位。

中国的强大追赶

中国的 DeepSeek 和其他小型模型表现出色,有非常强大的团队,西方可能仅领先"数月而非数年"。

算法创新是优势

尽管硬件和芯片领域存在竞争,但在算法创新方面,西方仍占据优势。中国的模型或公司尚未展示出在算法上超越现有技术水平的创新。

14:10 - 15:59

令人震惊但被低估的能力:多模态理解

核心观点

AI 最令人震惊但受关注最少的方面是其多模态理解能力,特别是对视频和现实世界的实时处理,这预示着 AI 开始具备深层的概念理解和实际操作能力。

视频处理的魔力

以 Gemini 处理 YouTube 视频为例,用户可以向它询问视频中的各种"不可思议的问题"。

它提出了一个非常有趣的哲学观点,关于抛弃日常生活,并以象征方式展示这一点。

Gemini 分析《搏击俱乐部》场景

实时辅助(Gemini Live)

用户可以用手机指向某个物体,AI 就能实时提供帮助。例如,如果你是一名技工,AI 可以指导你完成手头的任务。理想状态下,这应通过眼镜实现,以便解放双手。

15:59 - 19:12

Gemini 3:深度、细微差别与意外能力

核心观点

Gemini 3 的独特之处在于其展现出前所未有的深度和"细微差别"(Nuance),这种智能体现在其个性(简洁、敢于反驳)、创造力以及能够快速实现高层次指令的能力上。

细微差别(Nuance)的体现

独特的"个性"

它能简洁地回答问题,甚至在用户观点不合理时"温和地反驳"一些想法,让用户感觉它在智能上迈出了一大步。

令人惊讶的能力

"一击"生成游戏

下一版本可能能够通过几小时的语音编码,创造出原本需要数年才能完成的商业级游戏。

高水平的理解与输出

这种能力展示了模型理解"非常高层次的指令"并产生"非常详细的输出"的惊人深度和能力。

19:12 - 23:49

AGI 之路:科学家的务实与突破

核心观点

DeepMind 对 LLM 的"大转折"(pivot)是基于科学家的务实精神和对经验证据的服从。AGI 的实现预计在 5 到 10 年内,但仅靠规模化可能不足够,还需要一到两次"Transformer 级别"的重大算法突破。

科学家的实用主义

当团队看到"规模化开始奏效"的迹象时,他们立即将越来越多的资源投入到 LLM 这一研究分支。

AGI 的清晰定义与时间表

时间表

AGI 大约在 5 到 10 年内实现。

高门槛的定义

AGI 是一个具备人类所有认知能力的系统,包括发明和创造能力。

当前模型的缺陷

目前的 LLM 是"锯齿状的智能"(jagged intelligences),在某些领域表现惊人,但在其他领域有严重缺陷。

突破的必要性

单靠规模化可能无法达到终点。AGI 的实现可能还需要一到两次"Transformer 级别或 AlphaGo 级别"的重大突破。

23:49 - 26:03

行业热点与人才竞争

核心观点

Hassabis 对 AI 行业的投资热潮持谨慎乐观态度,认为部分领域存在泡沫;同时,DeepMind 在人才竞争中的核心策略是利用"使命驱动"和最前沿的研究来吸引顶尖人才。

AI 泡沫

虽然 AI 是史上最具变革性的技术,但某些部分可能存在泡沫,比如高达 500 亿美元的种子轮融资是"有点不可持续的"。

人才竞争

AI 人才争夺战已经"非常疯狂"。DeepMind 只招募"使命驱动"的人才。

自我驱动循环

如果 DeepMind 拥有最好的系统和最好的成果,这将形成一种"自我驱动"的循环,持续吸引最优秀的人才。

26:03 - 29:33

游戏、适应性与人类的未来

核心观点

游戏是训练人类思维的绝佳模拟场;尽管 AI 引发的颠覆是工业革命的十倍以上,但人类大脑具有无限的适应性,最终能够应对并驾驭 AGI 时代的到来。

从游戏中学到的决策艺术

训练思维的基石

Hassabis 的国际象棋背景以及后来的游戏训练,对他进行科学和商业工作至关重要。

现实世界的微观世界

最好的游戏(国际象棋、围棋、扑克)都是现实世界的"微观世界"。

反复练习决策

在游戏中,你可以根据需要练习你的决策制定能力,游戏就像是现实世界的一个"模拟器"。

人类大脑的无限适应性

人类的大脑是进化来适应"狩猎采集者"的生活方式的,但却成功地适应了现代文明和技术。这证明了人类的聪明才智是"无限可塑的"(infinitely adaptable)。

Demis Hassabis

AGI 之后,人类或许可以选择使用脑机接口(BCI)等技术来增强自身,这可能是人类"跟上"技术步伐的一种方式。

精华收获

01

科学方法是核心竞争力

在最激烈的技术竞争中,DeepMind 凭借将科学方法的"严谨和精确"应用于研究、工程和产品开发,确立了其独特的优势。

02

AGI 在即,需要算法突破

AGI 的到来(5-10 年)是确定且临近的,但实现"人类所有认知能力"需要超越现有规模化技术的,至少一到两次"Transformer 级别"的算法创新。

03

多模态是当前被低估的革命

当前 AI 最惊人的能力是其对视频和现实世界的多模态理解,这种能力将催生具备哲学洞察和实时操作能力的"通用助理"。

04

应对风险,资本主义助力

虽然存在恶意使用和智能体失控的非零风险,但市场的选择(企业要求模型保证可靠性)将激励 AI 提供者采取更负责任的行为。

05

人类的无限适应性

面对比工业革命更剧烈的颠覆,我们无需悲观。人类大脑是通用智能的证明,其强大的适应能力和未来与 AI 技术的融合(如 BCI)将确保人类能够驾驭新时代。