AI 洞察

OpenAI 总裁 Greg Brockman

这场对话发生在 AI 发展的关键时刻。OpenAI 刚刚宣布关闭视频生成项目 Sora,全力押注一个"超级应用"。Brockman 在这里坦诚分享了战略转向、对 AGI 进度的判断(70-80% 已实现),以及为何敢于投入 1100 亿美元建设算力基础设施。

主持人
Alex Kantrowitz
嘉宾
Greg Brockman
时长
约 73 分钟
观看完整对话

核心洞察

01

AGI 已实现 70-80%

Brockman 个人认为 AGI 已经实现了 70-80%,未来一两年内将达到。目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务仍困难。

02

超级应用战略

OpenAI 正在打造的超级应用将整合 ChatGPT、Codex 和浏览器,成为一个统一的"个人 AGI"——它了解你、与你的目标一致、值得信赖。

03

自动化 AI 研究员

OpenAI 正在开发一个自动化 AI 研究员,预计今年秋天推出,将能够像人类研究员一样进行端到端的科研工作。

04

1100 亿美元算力豪赌

OpenAI 将计算视为收入中心而非成本中心——目前的问题是"无法足够快地构建计算以满足需求"。

05

人类责任不可放弃

即使管理数十万个 AI 代理,你也不能"放弃责任"。人类能动性和问责制是系统的核心。

06

公众认知差距

AI 行业未能成功讲述技术改善生活的故事。从癌症诊断到创业工具,真实案例大量存在,但没有被广泛传播。

深度洞察

01

为什么放弃 Sora,转向 GPT 推理模型

[04:06 - 11:24]
核心观点

OpenAI 资源有限,必须在两条技术路线中做出选择:Sora 的"世界模型"路线,还是 GPT 推理模型路线。公司选择了后者。

深度阐述
技术树的分叉

Sora 模型(视频生成)和 GPT 系列(推理模型)实际上是两个完全不同的技术分支。同时推进两个分支在有限的算力下极其困难。OpenAI 并非完全放弃 Sora——相关研究正在机器人学领域继续——但公司清醒地认识到,机器人应用还处于研究阶段,而知识工作领域的 AI 技术将在未来一年迎来真正的爆发。

"迪士尼模式"的再思考

OpenAI 曾经设想像迪士尼一样,拥有一个核心技术优势,然后将其延伸到多个领域。但 Brockman 指出,Sora 代表的是一条不同的技术分支——基于扩散模型的世界模型路线。而 GPT 系列是另一条分支。算力有限、需求无限,同时追求两条路线几乎不可能。

机会太多的困境

Brockman 指出一个有趣的现象:在 AI 领域,最大的问题是"机会太多"。任何数学上合理的想法都能产生不错的结果。这证明了深度学习的强大——它不是在记忆数据,而是在理解生成数据的底层规则。

震撼的例子

一位物理学家研究某个问题多年无果,交给 OpenAI 的模型,12 小时后得到了解决方案。他说,这是第一次感觉模型在"思考",这个问题可能人类永远无法解决。

"这无关不同应用的重要性比较,而是关乎 OpenAI 的使命——向世界交付 AGI。我们看到了一条技术路径,知道如何推进工程、科研来实现它。你必须加倍、三倍投入,因为我们可以为人类解锁所有这些潜力。"
02

超级应用计划:你的个人 AGI

[11:24 - 18:35]
核心观点

OpenAI 正在构建一个统一应用,整合编程、浏览器和 ChatGPT,成为你的"个人 AGI"——了解你、与你目标一致、值得信赖的数字代理人。

深度阐述
三大功能整合

1. 编程(Codex):让任何人都能指挥计算机完成任务
2. 浏览器:AI 可以使用网页,你可以监督它的操作
3. ChatGPT:通用对话和知识工作

个人使用场景

演讲稿草拟和反馈、小生意点子头脑风暴、设置电脑热角等系统操作(Brockman 自己的使用案例)。

冰山一角

真正的变革在于技术底层的统一:AI 如何获取上下文、如何与世界连接、如何采取行动。OpenAI 正在将之前分散的实现方式整合为一个"AI 层",可以指向不同的应用。

记忆与个性化

ChatGPT 曾经没有记忆,每次对话都从零开始——就像和陌生人交谈。现在它会记住你们的互动,理解你的偏好。Pulse 功能每天为你推送你可能感兴趣的内容。未来,超级应用会更深入地连接你的邮件、日历、偏好设置,真正了解你,帮你实现目标。

"这就是计算机本来应该有的样子——让机器适应人类,而不是让人类去适应机器。"
03

竞争格局与 OpenAI 的反思

[18:35 - 23:01]
核心观点

Anthropic 率先推出了整合 Claude、Claude Co-work、Claude Code 的超级应用。OpenAI 承认在"最后一公里可用性"上曾经落后,但现在已经赶上。

深度阐述
"最后一公里"的教训

12-18 个月前,OpenAI 在编程领域一直有最佳表现,但投入不足的是"最后一公里的可用性"——让 AI 在真实世界场景中真正可用。AI 可以解决编程竞赛问题,但从未见过真实世界的代码库——那些混乱、不完美的代码。大约去年年中,OpenAI 开始认真对待这个问题,组建团队专注于识别所有差距,构建训练环境让 AI 体验真实的软件工程工作。

"最可怕的时刻"

当主持人问及竞争是否改变了公司内部氛围时,Brockman 分享了一个令人惊讶的答案:"OpenAI 最可怕的时刻其实是在我们发布 ChatGPT 之后。我记得在假期派对上感受到这种'我们赢了'的氛围。我从未有过这种感觉。我一直在想:不,我们是弱者,我们一直都是。"

"你永远不会像人们说的那么好,也永远不会像人们说的那么差。一直以来都很稳定。我对我们的路线图、研究投资极其有信心。在产品方面,我们有巨大的能量,所有这些都将汇聚在一起,交付给世界。"
04

Spud 模型与即将到来的能力飞跃

[22:59 - 28:13]
核心观点

"Spud" 是一个新的预训练基础模型,整合了约两年的研究成果。它代表的不是单次发布,而是一个加速进步的引擎。

深度阐述
模型开发的三个阶段

1. 预训练:产生新的基础模型
2. 强化学习:让 AI 应用知识,在不同场景中练习
3. 后训练:最后一公里的行为和可用性优化

"大模型气味"

Brockman 提到一个有趣的概念——"大模型气味":当模型真的更聪明、更有能力时,你会感觉得到。当你问一个问题,AI 似乎没有理解,那种失望感很强烈。而新一代模型会改变这种体验:你曾经感到沮丧、永远不会用 AI 做的事情,现在你会不假思索地使用它。

能力的双重提升

1. 提高天花板:解决更开放的问题、更长的时间跨度任务
2. 提高地板:对任何你想做的事情都更有用

心理模型的滞后

公众对 AI 能力的心理模型变化其实相当缓慢。当 AI 为你做了一件神奇的事,你会想"哇,它还能做这个?我从未想象过。"

05

自动化 AI 研究员与"起飞"阶段

[28:13 - 31:12]
核心观点

AI 正进入"起飞"(Takeoff)阶段——技术发展加速,同时可以用 AI 来改进 AI。OpenAI 正在打造"自动化 AI 研究员",预计今年秋天推出。

深度阐述
"起飞"的两个维度

1. 技术发展加速:因为可以用 AI 让 AI 变得更好
2. 现实世界影响:从配角变成经济增长的主要驱动力

AI 研究员的具体工作

AI 研究员将能够完成 OpenAI 研究科学家从端到端的工作。但不是完全放任不管。就像初级研究员,如果离开太久可能会走弯路。需要资深研究员或有远见的人提供反馈、审查结果、指导方向。

"我会把它想成一个系统,将大幅加速我们生产模型的能力,推动新的研究突破,让模型在现实世界更有用、更易用——而且速度越来越快。"
06

AGI 已实现 70-80%?

[35:58 - 38:45]
核心观点

Brockman 认为 AGI 已实现 70-80%,未来一两年内将达到。但目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务却做不到。

深度阐述
AGI 的"参差不齐"本质

我们现在拥有的技术非常参差不齐。在某些任务上绝对是超人的,比如编写代码,AI 可以直接完成。但有一些非常基本的任务是人类能做的,而我们的 AI 仍然很吃力。

在哪里画线?

"在哪里画线?更多是一种感觉,不是科学。如果五年前有人给我看今天的系统,我会说:'对,这就是我们谈论的 AGI。'但它太不同了,超出了我们的想象。我们需要相应调整心理模型。"

具体判断

"就我个人的定义,我认为我们接近了。我基本认为我们已经实现了 70-80%。我认为非常明确的是,未来一两年内我们将拥有 AGI——尽管仍然参差不齐,但几乎任何智力任务,关于如何使用你的计算机,AI 都能够完成。"

不确定性原理

Brockman 用量子力学的"不确定性原理"来类比 AGI 的定义——你可以争论它,但他的个人判断是几乎已经到了,再多一点就绝对是了。

07

编程代理的突破时刻:从 20% 到 80%

[38:45 - 42:19]
核心观点

2025 年 12 月是一个转折点——AI 编程能力从完成 20% 的任务跃升到 80%。Brockman 自己的测试提示词"为我建一个网站"曾经需要 4 小时和多次提示,现在一次就完成了。

深度阐述
质变的时刻

"这从'这是个不错的补充'变成了'你必须彻底改造工作流程来适应这些 AI'。"

个人测试案例

Brockman 分享了他的个人经历:他几年前学编程时建了一个网站,花了几个月。他的测试提示词以前需要 25 次提示、4 小时才能做好。12 月,一次提示就完成了,而且做得很好。

突破的原因

1. 更好的基础模型
2. 在每个创新轴线上持续推进

从"程序员的工具"到"每个人的工具"

Brockman 承认,他曾经认为 Codex 是给程序员用的。但随着技术进步,OpenAI 开始意识到,底层技术主要不是关于代码,而是关于解决问题——管理上下文、整合系统、思考 AI 如何集成和完成工作。如果你有愿景、有目标,你可以描述意图,AI 可以执行。突然间,"Codex 是给程序员用的"变成了"Codex 是给每个人用的"。

08

AI 代理的愿景与人类责任

[42:19 - 55:15]
核心观点

未来你将成为管理数十万个 AI 代理的 CEO,但你不能"放弃责任"——必须保持对问题的敏感度,人类能动性和问责制是系统的核心。

深度阐述
CEO 比喻

"当你让这些自主 AI 代理代表你工作时,你变成了管理数十万个代理船队的 CEO,它们完成你的目标、你的愿景。而你并不完全知道不同事情是如何解决的。"

不能放弃责任

Brockman 说:"这有好有坏。我们需要承认这些工具的优势,减轻它们的弱点。"关键点是问责制。如果你的代理搞砸了网站,影响了用户,不是代理的错,是你的错。你需要关心。"人类能动性、人类问责制,这是系统的核心部分。"

创业民主化

"创业的民主化绝对要来了。"但更令人兴奋的是"人类雄心天花板的提升"——就像 AlphaGo 的第 37 手,那步人类从未想出的棋,既有创意,又改变了人类对游戏的理解。"这将在每一个领域发生:科学、数学、物理、化学、材料科学、生物学、医疗保健、药物发现。甚至可能在文学、诗歌等其他领域。"

人类连接的终极价值

"作为人类意味着在这里,在场,与其他人类连接。我们将看到 AI 释放大量时间,增加人类连接,建立更多的人际纽带。"

09

1100 亿美元算力赌注背后的逻辑

[55:15 - 01:03:24]
核心观点

算力不是成本中心,而是收入中心——就像雇佣销售员,只要能销售产品,销售员越多,收入越多。OpenAI 建设算力的速度始终跟不上需求。

深度阐述
成本中心 vs 收入中心

"我们面临的巨大开支是算力。但你可以不把算力想成成本中心,而是收入中心。就像雇佣销售员——你想雇佣多少销售员?只要能销售产品,有可扩展的销售方式,销售员越多,收入越多。"

需求超过供给

OpenAI 不断发现,无法建设足够快的算力来满足需求。现在,OpenAI 必须做出关于发布什么、算力去哪里的非常痛苦的决定。

历史先例

"从我们发布 ChatGPT 的那一刻起,我记得与团队进行过这次对话,他们说:'我们应该买多少算力?'我说:'全部。'他们说:'不,不,不,真的,我们应该买多少算力?'我说:'无论我们建设多少,我知道我们都无法跟上需求。'从那以后,每年都是这样。"

为什么不是"YOLO"

Dario Amodei(Anthropic CEO)说有些玩家"YOLO"(过于激进),他非常担心。Brockman 不同意:"我们非常深思熟虑,非常清楚地看到即将发生的事情。今年,每个参与者都会感到算力紧张。我们是第一个意识到这一点的。"

风险与回报

"如果你开始担心下行情况——这是非常合理的问题——但赌注不是关于任何一家公司,而是关于整个行业。你相信这项技术可以生产并交付我们看到的大量价值吗?"

10

为什么公众仍然不信任 AI

[01:03:24 - 01:05:43]
核心观点

Yugo 调查显示,三倍多的美国人预期 AI 对社会的影响是负面的而非正面的。Brockman 认为,AI 行业未能成功帮助人们理解这项技术如何改善他们的生活。

深度阐述
生命被拯救的故事

Brockman 分享了他每天听到的具体故事:一个孩子头痛,被拒绝做 MRI。他们用 ChatGPT 研究症状,意识到可以向保险公司争取做 MRI。他们这样做了,结果是脑肿瘤。他们因为使用 ChatGPT 获得正确信息而挽救了孩子的生命。

故事没有被讲述

"但这个故事没有传出去。这发生在很多人的生活中,但故事还没有被讲述。"

流行文化的影响

Brockman 指出 90 年代的流行文化对 AI 非常负面,担心可能出错。但当人们真正使用 AI,找到效用和价值,他们就会改变看法。

"我确实非常担心我们没有成功帮助人们理解为什么这波技术浪潮将改善他们的生活,帮助增加人类连接。这是我心中的大重点。"
11

数据中心的争议与能源问题

[01:05:43 - 结束]
核心观点

民调显示,公众认为数据中心对环境、家庭能源成本和附近居民生活质量大多是负面的。Brockman 认为有很多错误信息,并承诺 OpenAI 不会推高能源价格。

深度阐述
关于用水量的误解

"关于数据中心肯定有很多错误信息。水使用就是个好例子。如果你看看我们的 Abene 设施——世界上最大的超级计算机之一——它一年的用水量与一个家庭相同。真的可以忽略不计。然而有很多错误信息说数据中心消耗大量用水。"

能源价格的承诺

"在电力方面,我们承诺不会推高人们的能源价格。作为行业,人们正在做出这些承诺,因为改善当地社区非常重要。"

电网升级的好处

"有真正的理由让老化、过时的电网升级。这实际上对社区有真正的好处。我们在北达科他州看到,人们的费率因为数据中心出现而下降了,因为它帮助改善每个人的公用事业。"

给恐惧 AI 的人的信息

"第一件事是试试这些工具,因为只有通过体验现在存在的 AI,才能真正理解它能为做什么。"

如何准备未来

"我认为第一件事是理解技术。我们看到的是,从技术中获得最多的人,带着好奇心接近它,真正尝试在你的工作流程中尝试它,真正克服'空白盒子'的初始障碍。真正发展这种能动感:我可以成为管理者。我可以设定方向。我可以授权。我可以提供监督。"

精华收获

01

AGI 时间表

Brockman 认为 AGI 已实现 70-80%,未来一两年内将达到。但目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务仍困难。

02

战略聚焦

OpenAI 放弃 Sora 的"世界模型"路线,专注于 GPT 推理模型树。这不是放弃视频生成,而是将研究重心整合到统一技术架构上。

03

超级应用愿景

一个整合编程、浏览器和 ChatGPT 的统一应用,将成为你的"个人 AGI"——了解你、与你目标一致、值得信赖。

04

算力即收入

1100 亿美元的基础设施赌注基于一个信念:算力不是成本中心,而是收入中心。需求永远超过供给。

05

人类责任不可放弃

即使管理数十万个 AI 代理,你也不能"放弃责任"。人类能动性和问责制是系统的核心。

06

公众认知差距

AI 行业未能成功讲述技术改善生活的故事。从癌症诊断到创业工具,真实案例大量存在,但没有被广泛传播。

07

"起飞"阶段已开始

AI 发展进入加速期——可以用 AI 改进 AI,同时从经济配角变成主要驱动力。

08

编程代理突破

2025 年 12 月是转折点,AI 编程能力从 20% 跃升到 80%。一夜之间,从"不错补充"变成"必须重组工作流程"。

09

创业民主化

AI 将让任何人都能创业,降低技术门槛,释放人类的创造力和雄心。

10

理解技术的最佳方式

带着好奇心尝试,在你的工作流程中真正使用它,发展"管理者思维"——设定方向、授权、监督。