Demis Hassabis 论 AGI、AI 未来与 DeepMind 的核心使命

01:02 - 03:29

诺贝尔奖与新的影响力平台

核心观点

诺贝尔奖为 Hassabis 提供了一个全新的、在全球范围内具有通用"快捷方式"效应的平台，使其能够更有效地向政府高层及公众倡导 AI 安全和负责任的使用，并帮助社会为 AGI 的到来做好准备。

深度阐述

Hassabis 坦言，虽然获奖已过去一年多，感觉依然"超现实"。诺贝尔奖最大的改变，不是带来新的资源（DeepMind 在 Google 内部已拥有巨大资源），而是赋能他去影响更广泛的群体。

影响力"快捷方式"

在与非 AI 领域的专业人士、特别是政府高层人士交流时，诺贝尔奖的声誉成为一种"快捷方式"，能迅速建立信任和专业度。

倡导关注点

1. AI 安全（短期与长期）：不仅是长期的 AGI 安全，也包括近期的 AI 负责任使用。
2. 社会准备：AGI 是"人类历史上最具变革性的时刻"，必须作为一个物种、一个社会整体来为此做准备。

如果你拥有诺贝尔奖，它就像一个快捷方式，能让几乎所有人知道你在这个领域是专家。

Demis Hassabis

03:29 - 05:25

科学优先：DeepMind 的核心竞争力

核心观点

DeepMind 的根本优势在于其核心的"科学方法"思维，这种严谨性、精确性与世界级的工程和基础设施的融合，使其在 AI 领域这场"史上最激烈的竞争"中占据优势。

三位一体的融合

要站在 AI 的前沿，必须具备三个世界级的要素，而 DeepMind 的独特之处在于能将它们融合：

1. 世界级的研究

World-class research

2. 世界级的工程

World-class engineering

3. 世界级的基础设施

World-class infrastructure

科学方法是"人类有史以来最重要的想法"，它创造了启蒙运动和现代科学，是现代文明的基石。

Demis Hassabis

05:25 - 08:37

未来 12 个月的 AI 进步与前景

核心观点

未来一年 AI 领域将迎来三个关键的、可预期的重大进展：模态融合能力的深化、世界模型的出现以及智能体（Agent）可靠性的飞跃，最终将使 AI 成为日常生活的"通用助理"。

三大发展方向

1. 模态融合的深化

Gemini 从一开始就被设计为多模态模型，能同时处理图像、视频、文本和音频。当视频处理能力与语言模型完全融合时，将产生"非常有趣的组合能力"。

2. 世界模型（World Models）

Genie 3 是一个交互式视频模型，用户可以像在游戏或模拟中在其中"走动"，视频在持续一分钟内保持连贯，预示着 AI 对物理世界运行规律的初步理解。

3. 智能体系统的成熟化

未来一年，DeepMind 的目标是将 Gemini 发展成"通用助理"（Universal Assistant），它将成为日常生活的"结构"（fabric of your life），每天被多次咨询。

08:37 - 13:08

AI 的乌托邦与潜在的恐惧

核心观点

AI 的最佳愿景是实现"激进的丰饶"（Radical Abundance），解决人类社会面临的最大问题；而最大的恐惧则来自恶意使用、智能体失控，以及在乌托邦实现后人类自身存在的目的性问题。

最佳场景：激进的丰饶

核心梦想

AGI 将解决社会和人类面临的大部分最大问题。

丰饶的实现

免费清洁的能源（如聚变或更优的电池/太阳能）、材料科学的突破（如半导体）、治愈绝大多数疾病等。

后稀缺时代

最终进入一个"后稀缺时代"（post-scarcity era），人类将繁荣发展，甚至能够探索星际，将意识传播到银河系。

最差恐惧：灾难性风险

恶意行为者（Bad Actors）：利用 AI 从事有害目的，如制造病原体、网络恐怖主义
AI 失控（Going off the rails）：当 AI 接近 AGI 并变得更具"能动性"（agentic）时，可能以某种方式脱离预设轨道

虽然 AI 失控的灾难性后果（P(doom)）是"非零的"，需要认真对待和减轻，但那些给出精确百分比的人是"胡言乱语"，因为"没人知道确切的数字"。

Demis Hassabis

13:08 - 14:10

中美 AI 竞赛：领先与差距

核心观点

美国和西方目前仍在 AI 领域保持领先，特别是在算法创新方面拥有优势；但中国的追赶速度非常快，领先优势可能已缩短至数月而非数年。

西方仍在领先

从最新的基准测试和系统来看，美国和西方仍然处于领先地位。

中国的强大追赶

中国的 DeepSeek 和其他小型模型表现出色，有非常强大的团队，西方可能仅领先"数月而非数年"。

算法创新是优势

尽管硬件和芯片领域存在竞争，但在算法创新方面，西方仍占据优势。中国的模型或公司尚未展示出在算法上超越现有技术水平的创新。

14:10 - 15:59

令人震惊但被低估的能力：多模态理解

核心观点

AI 最令人震惊但受关注最少的方面是其多模态理解能力，特别是对视频和现实世界的实时处理，这预示着 AI 开始具备深层的概念理解和实际操作能力。

视频处理的魔力

以 Gemini 处理 YouTube 视频为例，用户可以向它询问视频中的各种"不可思议的问题"。

它提出了一个非常有趣的哲学观点，关于抛弃日常生活，并以象征方式展示这一点。

Gemini 分析《搏击俱乐部》场景

实时辅助（Gemini Live）

用户可以用手机指向某个物体，AI 就能实时提供帮助。例如，如果你是一名技工，AI 可以指导你完成手头的任务。理想状态下，这应通过眼镜实现，以便解放双手。

15:59 - 19:12

Gemini 3：深度、细微差别与意外能力

核心观点

Gemini 3 的独特之处在于其展现出前所未有的深度和"细微差别"（Nuance），这种智能体现在其个性（简洁、敢于反驳）、创造力以及能够快速实现高层次指令的能力上。

细微差别（Nuance）的体现

独特的"个性"

它能简洁地回答问题，甚至在用户观点不合理时"温和地反驳"一些想法，让用户感觉它在智能上迈出了一大步。

令人惊讶的能力

"一击"生成游戏

下一版本可能能够通过几小时的语音编码，创造出原本需要数年才能完成的商业级游戏。

高水平的理解与输出

这种能力展示了模型理解"非常高层次的指令"并产生"非常详细的输出"的惊人深度和能力。

19:12 - 23:49

AGI 之路：科学家的务实与突破

核心观点

DeepMind 对 LLM 的"大转折"（pivot）是基于科学家的务实精神和对经验证据的服从。AGI 的实现预计在 5 到 10 年内，但仅靠规模化可能不足够，还需要一到两次"Transformer 级别"的重大算法突破。

科学家的实用主义

当团队看到"规模化开始奏效"的迹象时，他们立即将越来越多的资源投入到 LLM 这一研究分支。

AGI 的清晰定义与时间表

时间表

AGI 大约在 5 到 10 年内实现。

高门槛的定义

AGI 是一个具备人类所有认知能力的系统，包括发明和创造能力。

当前模型的缺陷

目前的 LLM 是"锯齿状的智能"（jagged intelligences），在某些领域表现惊人，但在其他领域有严重缺陷。

突破的必要性

单靠规模化可能无法达到终点。AGI 的实现可能还需要一到两次"Transformer 级别或 AlphaGo 级别"的重大突破。

23:49 - 26:03

行业热点与人才竞争

核心观点

Hassabis 对 AI 行业的投资热潮持谨慎乐观态度，认为部分领域存在泡沫；同时，DeepMind 在人才竞争中的核心策略是利用"使命驱动"和最前沿的研究来吸引顶尖人才。

AI 泡沫

虽然 AI 是史上最具变革性的技术，但某些部分可能存在泡沫，比如高达 500 亿美元的种子轮融资是"有点不可持续的"。

人才竞争

AI 人才争夺战已经"非常疯狂"。DeepMind 只招募"使命驱动"的人才。

自我驱动循环

如果 DeepMind 拥有最好的系统和最好的成果，这将形成一种"自我驱动"的循环，持续吸引最优秀的人才。

26:03 - 29:33

游戏、适应性与人类的未来

核心观点

游戏是训练人类思维的绝佳模拟场；尽管 AI 引发的颠覆是工业革命的十倍以上，但人类大脑具有无限的适应性，最终能够应对并驾驭 AGI 时代的到来。

从游戏中学到的决策艺术

训练思维的基石

Hassabis 的国际象棋背景以及后来的游戏训练，对他进行科学和商业工作至关重要。

现实世界的微观世界

最好的游戏（国际象棋、围棋、扑克）都是现实世界的"微观世界"。

反复练习决策

在游戏中，你可以根据需要练习你的决策制定能力，游戏就像是现实世界的一个"模拟器"。

人类大脑的无限适应性

人类的大脑是进化来适应"狩猎采集者"的生活方式的，但却成功地适应了现代文明和技术。这证明了人类的聪明才智是"无限可塑的"（infinitely adaptable）。

Demis Hassabis

AGI 之后，人类或许可以选择使用脑机接口（BCI）等技术来增强自身，这可能是人类"跟上"技术步伐的一种方式。

精华收获

科学方法是核心竞争力

在最激烈的技术竞争中，DeepMind 凭借将科学方法的"严谨和精确"应用于研究、工程和产品开发，确立了其独特的优势。

AGI 在即，需要算法突破

AGI 的到来（5-10 年）是确定且临近的，但实现"人类所有认知能力"需要超越现有规模化技术的，至少一到两次"Transformer 级别"的算法创新。

多模态是当前被低估的革命

当前 AI 最惊人的能力是其对视频和现实世界的多模态理解，这种能力将催生具备哲学洞察和实时操作能力的"通用助理"。

应对风险，资本主义助力

虽然存在恶意使用和智能体失控的非零风险，但市场的选择（企业要求模型保证可靠性）将激励 AI 提供者采取更负责任的行为。

人类的无限适应性

面对比工业革命更剧烈的颠覆，我们无需悲观。人类大脑是通用智能的证明，其强大的适应能力和未来与 AI 技术的融合（如 BCI）将确保人类能够驾驭新时代。