AI 洞察

智能的未来 对话德米斯·哈萨比斯

从可控核聚变到世界模型,从意识起源到后 AGI 社会——处于人类历史转折点的科学家,揭示通往通用人工智能的关键路径

主持人
Hannah Fry
嘉宾
Demis Hassabis
时长
约 56 分钟
观看完整访谈

核心要点

01

根节点问题

AlphaFold 证明了 AI 能解决科学领域的核心难题。当前核聚变、材料科学、室温超导体都是同样的思路——这是真正改变世界的路径。

02

参差不齐的智能

AI 能在国际奥赛夺金牌却犯高中错误。真正智能的核心是一致性而非峰值性能。通往 AGI 的关键是让所有任务都保持可靠水平。

03

世界模型的重要性

语言只是现实的一层映射。从语言模型到世界模型的跨越,是 AI 从"理解关于世界的话语"到"理解世界本身"的关键转变。

04

扩展定律没有撞墙

AI 扩展没有遇到墙壁,只是进入了"收益递减"阶段——仍然值得,但不再是指数级的。50% 的努力在扩展,50% 的努力在创新。

05

10 倍速的工业革命

AI 革命可能像工业革命一样巨大,但会在 10 年而不是 100 年内展开。社会适应的时间窗口被压缩了 10 倍。

06

5-10 年不是很长时间

对于理解、准备、治理即将到来的变化,这个窗口正在迅速关闭。人类社会似乎还没有真正开始思考这些问题的规模和深度。

深度洞察

01

2025 年:十年压缩进一年

00:01:42 - 00:05:14
核心观点

2025 年是 AI 发展的爆发之年,世界模型的进展最为激动人心。哈萨比斯形容过去一年的变化速度是"把十年压缩进了一年"。

深度阐述
Gemini 3 与世界模型突破

Google DeepMind 在这一年发布了 Gemini 3,多模态能力达到前所未有的水平。但更重要的是"世界模型"的突破。不同于只能处理文本和图像的语言模型,世界模型试图理解世界的因果和物理规律。这是 AI 从"理解语言"向"理解现实"跨越的关键一步。

根节点问题战略

关于 DeepMind 著名的"根节点问题"战略——用 AI 解决科学领域的核心难题,解锁下游的广泛应用,哈萨比斯给出了令人振奋的进展:

AlphaFold 五周年:AlphaFold 2 震撼世界已过去五年,它证明了 AI 确实能解决根节点级别的科学难题。

材料科学突破在望:室温超导体、更好的电池、新型材料——这些都在进行中,进展比预期更快。

核聚变合作伙伴关系:DeepMind 与 Commonwealth Fusion Systems 建立了深度合作。这家公司被认为是传统托卡马克反应堆领域最接近突破的初创企业。DeepMind 将帮助他们在等离子体约束和材料设计上加速进展。

核聚变:能源领域的圣杯

核聚变一直是能源领域的"圣杯"。哈萨比斯指出,太阳能本质上就是在利用"云层中的聚变反应堆",但如果人类能够拥有模块化的聚变反应堆,实现几乎无限的可再生清洁能源,世界将彻底改变。

这正是"根节点问题"的典型例子。它不仅能直接解决能源、污染和气候危机,还会开启一系列连锁反应——如果能源真正变得可再生、清洁且几乎免费,许多当前不可行的事情将变得可能:

水资源问题:可以在任何地方建立海水淡化厂

太空探索:可以从海水中提取氢和氧制造火箭燃料

经济发展:能源成本消失后,大量产业将被重塑

量子协作循环

哈萨比斯还提到与 Google 量子 AI 团队的合作——DeepMind 用机器学习帮助量子计算进行错误纠正,未来量子计算也可能反过来帮助 AI。这是一个完美的协作循环。

02

参差不齐的智能

00:05:14 - 00:07:32
核心观点

当前的 AI 系统存在严重的"参差不齐"问题——在国际数学奥赛中获得金牌,却在高中数学上犯基础错误。这种不一致性必须解决,否则无法实现真正的通用人工智能。

深度阐述
矛盾的现象

AI 可以在国际数学奥赛中夺得金牌,解决世界上只有顶尖学生才能完成的难题。但如果用某种特定方式提问,它会犯非常基础的逻辑错误。它还无法下出像样的国际象棋棋局,这令人惊讶。

问题所在

哈萨比斯称之为"参差不齐的智能"。这些系统在某些领域达到博士水平,在其他领域却连高中水平都不到。这种不均匀的表现说明某种根本性东西仍然缺失。

可能的原因

一致性问题:通用智能应该在所有任务上保持一致性。

感知与分词:某些情况下是因为图像被感知和分词的方式导致的——比如系统可能没有"看到"每个字母,导致单词字母计数错误。

推理与思考:系统现在有"思考"能力,可以在推理时花更多时间,但还不够一致——它没有充分利用思考时间来复核答案,没有有效使用工具验证输出。

哈萨比斯估计,在解决一致性问题上,他们大概只走了一半的路。

03

AlphaGo 的数学版本?

00:07:32 - 00:09:30
核心观点

当前的模型更像 AlphaGo 而非 AlphaZero——它们从人类知识开始,还未实现完全自主的知识发现。

深度阐述
当前状态(AlphaGo 式)

大型语言模型从所有人类知识开始(互联网上的内容),将这些知识压缩成有用的模型,模型可以查询和泛化。

缺失的能力

还没有像 AlphaGo 那样的"搜索"或"思考"层,无法用模型来指导有用的推理链、规划和问题解决,无法可靠地使用这些系统找到最佳解决方案。

为什么更容易?

AlphaGo 面对的只是一个游戏,环境封闭、规则明确。而现实世界开放、复杂得多。

未来的方向

一旦有了类似 AlphaGo 的系统,就可以像 Alpha 系列那样,创造出能够自主发现知识的 AlphaZero 式系统。但这显然更困难。

关键缺失组件

当前系统还有一个致命缺陷——缺乏在线学习和持续学习能力。系统被训练、对齐、微调后部署到世界,但不会像人类一样持续学习和适应。这是 AGI 之前必须解决的另一个关键缺失环节。

04

科学理想与商业现实的张力

00:09:30 - 00:12:42
核心观点

哈萨比斯曾希望将 AI 留在实验室更长时间,专注于攻克癌症等科学难题。但聊天机器人的出现打乱了这一切。

深度阐述
失去与获得

哈萨比斯坦诚地说,他们既失去了一些东西,也获得了一些东西。原本更纯粹的科学路径是他在 15-20 年前的设想——那时几乎没有人研究 AI,人们认为这是个疯狂的事情。

最初的计划

逐步向 AGI 推进;对每个步骤都保持谨慎;分析系统行为,考虑安全性;在通往 AGI 的路上,同时将技术分支应用到科学和医学领域;向世界发布这些应用,就像 AlphaFold 那样。

现实的转折

聊天机器人变得可行且受欢迎,然后演变成了可以做更多事情的基础模型——图像、视频、各种模态。这在商业和产品层面都取得了巨大成功。

哈萨比斯的两面性

他热爱这个方向。他一直梦想拥有终极助手——能提高生产力,甚至保护大脑空间,帮助人们进入心流状态,而不是被社交媒体的噪音淹没。

但代价是

这创造了一场疯狂的竞争——许多商业组织甚至国家都在竞相改进和超越对方。这使得同时进行严谨的科学研究变得困难。

好消息是

大量资源涌入这个领域,加速了进展;普通公众只落后绝对前沿几个月;所有人都能亲身感受 AI 是什么样的;政府也开始更好地理解这项技术。

DeepMind 试图在两者之间找到平衡,哈萨比斯认为他们正在做对。

05

扩展定律没有撞墙

00:12:42 - 00:17:43
核心观点

AI 扩展没有遇到墙壁,只是进入了"收益递减"阶段——仍然值得,但不再是指数级的。

深度阐述
哈萨比斯的回应

他们从未真正看到任何"墙"。更准确的说法是"收益递减"(diminishing returns)——但人们往往认为这意味着零回报,实际上在指数增长和零增长之间有很大空间。

当前阶段

不再是每次迭代都在所有基准上性能翻倍(3-4 年前的早期阶段可能如此),但仍然获得显著改进(如 Gemini 3),投资回报率仍然值得。

数据耗尽问题

确实存在可用数据耗尽的问题,但有解决方案:

合成数据:系统已经足够好,可以开始生成自己的训练数据。

验证领域:在编程和数学等领域,可以验证答案正确性,产生无限数据。

DeepMind 的优势

他们一直以研究为先,拥有业界最广泛、最深厚的研究团队。回顾过去十年的重大突破——transformers、Alpha Zero——都来自 Google 或 DeepMind。

哈萨比斯喜欢"地形变难"的时候,因为这不再只是需要世界级工程,还需要世界级科学研究。而 DeepMind 拥有这种组合:

- 50% 的努力在扩展

- 50% 的努力在创新

两者都需要才能到达 AGI。

幻觉问题

即使像 Gemini 3 这样卓越的模型,仍然存在幻觉问题。一个指标显示,它在本应拒绝回答时仍然给出答案。

哈萨比斯承认他们需要像 AlphaFold 那样的置信度评分。当前模型的问题在于:系统有下一个 token 的概率,但那是局部的;缺乏对整个事实或陈述的整体置信度评估;需要使用思考步骤和规划步骤来回溯检查输出;模型有时会"强迫"自己回答,即使不应该。

一个形象的比喻:现在的模型就像一个人在糟糕的日子里,脑子里想到什么就直接说出来,没有停顿、反思、调整。

06

世界模型与模拟

00:17:43 - 00:25:47
核心观点

世界模型是哈萨比斯最持久的热情所在。语言很丰富,但无法捕捉空间动态、物理规律——这些需要"体验"而非"描述"。

深度阐述
为什么需要世界模型

语言模型能理解世界的很多内容,甚至比预期更多,因为语言本身比我们想象的更丰富。但仍然有很多东西是语言难以描述的:

空间动态:空间意识、物理环境

机械原理:事物如何运作、如何移动、如何表现

感官体验:运动角度、气味——这些传感器数据很难用语言描述

如果想要机器人技术真正工作、拥有能在日常生活中陪伴你的通用助手(眼镜、手机上)、AI 不只是在电脑上而是真正帮助你的日常生活,就需要这种世界理解,而世界模型是其核心。

如何证明拥有世界理解

一个方法是生成逼真的世界——如果能生成,说明系统一定理解了世界的很多机制。这就是为什么 Genie、VO 等视频模型和交互式世界模型既令人印象深刻,又是向通用模型迈进的重要步骤。

应用前景

机器人技术:最终可以应用到这里

通用助手:需要世界理解才能真正有用

游戏:哈萨比斯坦言,他肯定会再次将其应用到游戏上,创造终极游戏——这可能是他潜意识的整个计划

科学应用

世界模型对科学也大有裨益。构建科学复杂领域的模拟,无论是材料科学(原子层面)还是生物学,甚至天气系统——从原始数据学习这些系统的动态,可以比暴力计算更高效地重现这些动态。

Simma × Genie:两个 AI 的互动

DeepMind 的 Simma 项目将智能体放入虚拟世界(如《无人深空》这样的复杂游戏),可以与它们对话并分配任务。而当 Genie 插入 Simma 时,神奇的事情发生了:

- Simma 智能体试图导航这个世界

- Genie 将 Simma 当作玩家/化身

- Genie 根据 Simma 的尝试实时生成世界

- 两个 AI 在彼此的"思维"中互动

这可能是一个有趣训练循环的开始:几乎无限的训练样本;自动生成和解决数百万个任务;难度不断增加。

这些 Simma 智能体也可以作为出色的游戏同伴——"无聊 NPC 的终结"。

物理准确性的挑战

一个关键问题:如何确保生成的世界真实可信?避免看起来合理但物理错误的"幻觉"?

哈萨比斯坦诚这可能是问题所在。在某些情况下,幻觉是好事——创造性和新颖性需要一点"幻觉"。但训练 Simma 智能体时,不希望 Genie 产生错误的物理幻觉。

他们的解决方案是创建"物理基准":使用物理引擎非常准确的游戏引擎;生成简单的视频(如 A Level 物理实验):球滚下不同轨道、速度测量;测试模型是否 100% 准确地封装了牛顿三定律。

目前,VO 和 Genie 的模型是近似值,随意观看时看起来逼真,但还不足以可靠地用于机器人技术。

下一步是生成大量基本事实视频——摆锤、两个摆锤相互作用,然后很快进入三体问题(无论如何无法解析解决)。

但令人惊叹的是,当看到像 VO 这样的视频模型处理反射和液体的方式时,至少肉眼看已经相当准确了。真正的挑战是:超越人类业余感知者能够感知的范围,它是否能在真正的物理级实验中站得住脚?

07

模拟中的进化与意识

00:25:47 - 00:28:27
核心观点

意识可能是进化的结果——理解他人内心状态的优势最终转向内部。哈萨比斯希望在模拟中重新运行进化。

深度阐述
重新运行进化

哈萨比斯很想在未来某个时候运行这个实验——重新运行进化,几乎重新运行社会动力学。

他提到圣塔菲研究所曾运行过很多酷炫的网格世界实验,主要是经济学家在其中尝试运行小型人工社会。如果让智能体在正确的激励结构下运行足够长时间,各种有趣的事情会被"发明"出来——市场、银行等所有疯狂的东西。

更深层的动机

哈萨比斯从一开始对 AI 工作的热情之一,就是认为需要这些工具来真正理解:

- 我们来自哪里

- 这些现象(意识、生命起源)是什么

模拟作为科学工具

模拟可能是解决这些最强大问题的工具之一,因为可以:多次运行模拟;稍微改变初始条件;以非常可控的实验方式理解细微差异;这在现实世界中对任何真正有趣的问题都很难做到。

准确模拟将成为科学的巨大福音。

安全考虑

考虑到这些模型的涌现属性——我们没预料到的概念理解——是否需要谨慎运行这种模拟?

哈萨比斯认为确实需要,但模拟的好处是:可以在相当安全的沙盒中运行;最终可能需要完全隔离(air gap);可以 24/7 监控发生的事情;拥有所有数据访问权限。

但模拟中的 AI 将如此复杂,有太多事情发生,人类科学家很难跟上。可能需要使用其他 AI 系统来帮助分析和标记模拟中任何有趣或令人担忧的事情。

08

AI 泡沫:短期过度炒作,长期严重低估

00:28:27 - 00:31:56
核心观点

AI 短期被过度炒作,长期却被严重低估。当前某些领域存在泡沫,但这是新技术的自然过度反应。

深度阐述
哪些领域存在泡沫?

初创公司融资:基本上还没起步的初创公司,种子轮就达到数百亿美元估值,这很难说是可持续的。

大型科技公司估值:但这里有真正的业务基础,情况不同。

这是二元问题吗?

哈萨比斯认为不是非黑即白。AI 生态系统的某些部分可能处于泡沫中,其他部分则不是。

历史规律

对于任何全新的、变革性的、深刻的技术——AI 可能是最深刻的——都会出现某种"过度矫正":

- DeepMind 刚开始时:没人相信,没人认为可能

- 10-15 年后:AI 似乎成为商业世界中唯一的话题

这是对之前"反应不足"的"过度反应"。互联网经历过,移动设备经历过,AI 正在经历或将经历。

哈萨比斯的态度

他不太担心是否在泡沫中,因为作为 Google DeepMind 的负责人:无论哪种情况,他们的工作都是确保 Google/Alphabet 强势走出;他们处于极佳位置;如果继续按现在的轨迹发展——继续推进 AGI;如果出现回调——他们有自己的 TPU 堆栈,Google 的所有产品都可以插上 AI。

AI 正在改变 Google 产品

- 搜索:被 AI 概览、AI 模式彻底革命化

- 工作区:邮箱、YouTube、Chrome

- Gemini 应用:通用助手理念,表现出色

不需要依赖新产品,只需要为现有生态系统提供动力——这正是过去一年发生的事情,效率很高。

09

构建伦理 AI:不要重蹈社交媒体覆辙

00:31:56 - 00:34:31
核心观点

不应该像社交媒体那样为最大化用户参与度而构建 AI。但如何在避免"一人回声室"的同时,让用户成为自己宇宙的中心?

深度阐述
我们看到了什么

- 一些过度谄媚的系统

- 回声室强化效应——这对个人非常有害

- 人们花太多时间与聊天机器人对话,最终陷入自我激进化

Gemini 3 的个性设计

哈萨比斯亲自参与了个性设计,他很高兴结果:

温暖、有帮助、轻松

但简洁、直切要点

会以友好的方式反驳无意义的事情

不会说"地球是平的吗?好主意!"来强化错误观念。

平衡的挑战

人们希望系统支持他们的想法和头脑风暴;但也需要平衡;需要开发个性和角色的"科学"。

可能的架构

- 基础个性:产品自带,试图坚持科学方法

- 个性化层:用户可以调整——更多幽默还是更少,更简洁还是更冗长

- 但核心基础个性每个人都应该获得

哈萨比斯对当前方向相当满意。他们希望人们将这些系统用于科学、医学、健康问题等领域,因此遵循科学方法是个性的核心。

10

AGI:通用的图像智能与工业革命的启示

00:34:31 - 00:44:44
核心观点

Gemini 3 和图像生成工具结合展示了 AGI 的轮廓。我们可以从工业革命学到很多关于如何减轻 AGI 带来的干扰。

深度阐述
Gemini 3:非常强大的基础模型

图像生成工具的高级版本,令人惊叹的是它也有 Gemini 作为"大脑":不仅理解图像,还理解图像中的语义内容;可以标记复杂飞机的所有部件;可以可视化拆解的不同部分;对力学和材料有深刻理解;能够非常准确地渲染文本。

这正在成为图像领域的 AGI——一个可以处理图像相关任何事情的通用目的系统。

工业革命的历史教训

哈萨比斯最近读了很多关于工业革命的书。他认为我们可以学到很多:

英国的纺织业:第一台计算机实际上是缝纫机;后来成为早期 Fortran 计算机的打孔卡;英国因自动化系统而成为纺织中心。

工业革命的成果:儿童死亡率下降;现代医学;卫生条件;工作与生活的分离。

但也伴随挑战:花了大约一个世纪;不同劳动力群体在不同时间被取代;必须创造新事物;工会等新组织必须建立以重新平衡。

整个社会不得不逐渐适应,然后才有了现代世界。

这次的不同

哈萨比斯认为这次可能:规模大 10 倍;速度快 10 倍;在十年内展开而不是一个世纪。

后 AGI 社会的经济系统

Shane Legg(DeepMind 联合创始人)最近谈到,当前以劳动换取资源的经济系统在后 AGI 社会将无法以相同方式运作。

哈萨比斯开始花更多时间思考这个问题,Shane 正在领导一个研究后 AGI 世界的项目。但社会整体需要更多思考这个问题:经济学家和社会科学家;政府。

工作周和整个工作世界将再次改变,可能需要新的经济系统来帮助转型,确保收益广泛分配。普遍基本收入可能是解决方案的一部分,但可能不是完整的解决方案。

可能的创新系统

哈萨比斯提到经济学家朋友正在头脑风暴的想法:

- 更直接的民主类型系统

- 可以用一定数量的"信用额度"投票支持想看到的事情

- 地方社区层面:这里有资金,你要游乐场、网球场还是学校额外教室?

- 可以衡量结果,那些投票支持结果更好的人在下次投票中有更大影响力

哲学层面

- 工作会改变

- 如果解决了核聚变,就会有丰富的免费能源——后稀缺社会

- 钱会发生什么?

- 如果很多人从工作中获得目标感,那么目标会发生什么?

这些问题从经济问题几乎混合成了哲学问题。

国际合作的需要

哈萨比斯担心人们似乎没有注意或行动得像他希望的那样快。在理想世界中,会有更多的国际合作和研究。

即使是他们的时间线——5-10 年——对机构来说也不长。他担心的是:现有机构似乎非常分散;影响力不足以达到需要的水平;可能没有合适的机构来处理这个问题;加上当前的地缘政治紧张局势,合作似乎比以往任何时候都更困难。

唤醒的契机

他希望不需要"事件"就能让人们坐起来注意。大多数主要实验室都相当负责任。但也有商业压力推动负责任的行为——企业客户需要知道代理的界限和护栏。

但会有流氓行为者——流氓国家、流氓组织、可能在开源之上构建的人。那时可能会出问题。

他希望那只是"中等规模"的,成为给人类的"警告射击",然后可能会倡导国际标准或国际合作——至少就人们想要和同意的基本高层标准而言。他希望这是可能的。

11

图灵机与意识的极限

00:44:44 - 00:49:06
核心观点

如果我们构建 AGI 并用它作为心灵的模拟,然后与真实心灵比较,我们就能看到差异——也许那是创造力、情感、做梦、意识。

深度阐述
中心问题

如果我们构建通用人工智能并使用它作为心灵的模拟,然后与真实心灵比较,我们将看到差异,以及人类心灵中可能仍然特殊和独特的东西。那可能是什么?创造力?情感?做梦?意识?

图灵机的问题

这回到了图灵机问题:图灵机的极限是什么?

哈萨比斯认为这是他生活的中心问题,自从他发现图灵和图灵机以来。他爱上了这个,这是他的核心热情。他们一直在做的一切都是将图灵机能做什么的概念推向极限,包括折叠蛋白质。

极限在哪里?

他不确定极限是否存在,也许根本没有。

量子计算观点

量子计算的朋友会说存在极限,你需要量子计算机来处理量子系统。哈萨比斯不太确定,他与一些量子专家讨论过,也许我们需要来自量子系统的数据来创建经典模拟。

心灵的本质

这回到了心灵——它是全部经典计算,还是有其他事情发生?

- 罗杰·彭罗斯相信大脑中有量子效应

- 如果有,而且那就是意识,那么机器永远无法拥有它(至少经典机器)

- 如果没有,那么可能没有任何极限

哈萨比斯的猜测

如果让他现在猜测:

- 宇宙中的一切在计算上都是可处理的

- 因此,如果你以正确的方式看待它,图灵机可能能够模拟宇宙中的一切

- 他在这个基础上工作,直到物理学证明不是这样

至今为止

没有人发现宇宙中任何不可计算的东西。至少到目前为止。

感官体验的可计算性

当被问及——我们脸上的灯光温暖、背景机器的嗡嗡声、手下的桌子感觉——所有这些都能被经典计算机复制吗?

哈萨比斯说这是他热爱 Kafka 的原因——他所有的哲学都是心灵构建的:

- 所有这些东西以不同的方式进入我们的感官装置

- 它们感觉不同

- 但最终,它们只是信息

- 我们是信息处理系统

- 这就是生物学

- 这就是他们通过 Isomorphic 试图做的事情——将生物学视为信息处理系统

信息的终极性

哈萨比斯在业余时间(他只有两分钟业余时间)研究物理理论——关于信息是宇宙最基本单位的东西,不是能量,不是物质,而是信息。

也许最终这些都是可互换的,我们只是以不同的方式感觉它们。但据我们所知,所有这些惊人的传感器仍然可由图灵机计算。

为什么模拟世界如此重要?

因为那将是找到"我们能模拟什么的极限"的一种方式。如果你能模拟它,那么在某种意义上,你已经理解了它。

12

领导者的重负与人类的好奇心

00:49:06 - 00:55:59
核心观点

这是一个矛盾的位置——无比兴奋,但责任巨大。哈萨比斯一辈子都在为此训练,但某些事情的冲击仍然超出了预期。

深度阐述
情感重量

- 哈萨比斯睡眠不多——部分是因为工作太多,部分是因为难以入睡

- 复杂的情绪需要处理

- 无比兴奋——做着他梦想的一切

- 处于科学的绝对前沿——应用科学和机器学习

- 几乎每月都有第一次发现某事的感觉——这对所有科学家来说都是令人兴奋的

理解的负担

但那些从事这项工作很长时间的人(他和 Shane Legg 等)比任何人都更了解即将到来的事情的巨大规模。这实际上仍然被低估了——10 年时间尺度上会发生什么,包括:

- 哲学层面

- 作为一个人类意味着什么

- 什么重要

这是一个巨大的责任。但他们有一个惊人的团队在思考这些问题。

一生的训练

哈萨比斯说他一辈子都在为此训练——从早期下棋、然后从事计算机和游戏与模拟、神经科学——都是为了这一刻。大致就是他想象的样子,这也是他应对的方式——训练。

意外的冲击

有没有什么打击比预期更大的事情?

当然有。即使 AlphaGo 比赛——看到他们如何破解围棋,但围棋是美丽的谜题,他们改变了它。那很有趣但也苦乐参半。

最近的事情——语言和图像——对创造力意味着什么?哈萨比斯对创意艺术有巨大的尊重和热情,他自己做过游戏设计,他与电影导演交谈过——这对他们来说也是一个有趣的双重时刻:

- 一方面,这些工具加速原型设计想法 10 倍

- 另一方面,它是否在取代某些创造性技能?

到处都是这些权衡,对于像 AI 这样强大和变革性的技术是不可避免的——就像过去的电力和互联网一样。

人类的故事

人类是工具制造动物,这也是我们喜欢做的。出于某种原因,我们还有一个能够理解科学和从事科学的大脑,这令人惊叹。但也永不知足地好奇。

哈萨比斯认为这就是人类意义的核心。他从一开始就有这种"bug"。他对这个问题的表达尝试就是构建 AI。

AI 领导者之间的团结?

当 AI 领导者在一个房间里时,是否有团结感——一群人都知道利害关系,都真正理解这些事情?还是竞争将他们分开?

他们互相认识,哈萨比斯几乎与所有人都相处得很好(虽然其他人之间不一定)。

这很困难,因为他们处于史上最激烈的资本主义竞争中。经历过互联网时代的投资人和 VC 朋友说,这比那个时代激烈 10 倍。

在许多方面,哈萨比斯热爱竞争——他从下棋时代就一直热爱竞争。

但退后一步,他希望每个人都理解,比公司成功更重要的是更大的事情。

接下来最担心的是什么?

哈萨比斯认为当前系统是"被动的"——你投入能量作为用户(问题或任务),系统提供一些摘要或答案。非常人类导向,人类能量和想法进入。

下一阶段是基于代理的系统,他认为他们很快会开始看到(现在已经看到了,但还很原始)。在未来一两年内,他将开始看到一些真正令人印象深刻和可靠的系统。

作为助手,它们将非常有用和强大,但也会更加自主,因此风险也会上升。

他对这些类型的系统在两三年内可能能够做的事情相当担心。他们正在为此准备网络防御——为可能数百万代理在互联网上漫游的世界做准备。

最期待的是什么?

有没有一天他可以退休,知道工作完成了?

他绝对可以休假,甚至一天也好。但他的使命一直是帮助世界安全地将 AGI 带过终点线,造福全人类。

当他们到达那一点时,当然还有超级智能、后 AGI 以及他们讨论的所有经济和社会问题,他可能以某种方式提供帮助。

但他认为那将是他核心生活使命的完成——如果只是帮助世界将那个小任务带过终点线。他需要合作,他是一个相当合作的人,他希望能从他的位置帮助实现这一点。

然后他就可以去度假了——一个应得的休假。

精华收获

1

根节点问题的战略价值

与其在表层应用上竞争,不如攻克那些一旦解决就能解锁整个领域的关键难题。AlphaFold 证明了这一点,现在的核聚变、材料科学、室温超导体都是同样的思路。这是真正改变世界的路径。

2

参差不齐的智能现象

当前 AI 的矛盾性令人深思——国际奥赛金牌水平却犯高中错误。这暴露了真正智能的核心是一致性而非峰值性能。通往 AGI 的关键不是让某项任务达到超人水平,而是让所有任务都保持在可靠水平。

3

世界模型的重要性

语言只是现实的一层映射,而世界模型试图理解现实本身。从语言到世界模型的跨越,是 AI 从"理解关于世界的话语"到"理解世界本身"的关键转变。这解释了为什么机器人技术需要世界模型,为什么科学需要模拟。

4

意识可能是可计算的

哈萨比斯对图灵机的执着令人动容。他倾向于相信宇宙中的一切都是可计算的,包括意识、情感、创造力——所有这些"人类特质"最终可能都是信息处理的不同形式。这是一个极具争议但又令人兴奋的世界观。

5

10 倍速的工业革命

历史不会重复,但会押韵。AI 革命可能像工业革命一样巨大,但会在 10 年而不是 100 年内展开。这意味着社会适应的时间窗口被压缩了 10 倍——我们需要现在就开始思考后 AGI 世界的经济系统、社会结构、人类目标。

6

责任与兴奋的矛盾

处于人类历史转折点的人承受着独特的心理压力——既有探索前沿的科学兴奋,又有理解即将到来的灾难性变化的清醒认知。哈萨比斯的应对方式是一生的训练,以及承认这是他一辈子都在等待的时刻。

7

竞争与合作的张力

AI 领导者之间存在真正的相互理解,但也被最激烈的资本主义竞争撕裂。这种矛盾反映了整个领域面临的困境——技术发展的速度与安全治理的需求之间的张力。

8

好奇心作为人类本质

人类是工具制造者,也是科学理解者。哈萨比斯将构建 AI 视为人类好奇心的终极表达——这是试图理解智能本身、意识本身、甚至宇宙本身的努力。他一生的热情,从棋类到游戏到神经科学,都指向同一个终点。