这场对话发生在 AI 发展的关键时刻。OpenAI 刚刚宣布关闭视频生成项目 Sora,全力押注一个"超级应用"。Brockman 在这里坦诚分享了战略转向、对 AGI 进度的判断(70-80% 已实现),以及为何敢于投入 1100 亿美元建设算力基础设施。
观看完整对话Brockman 个人认为 AGI 已经实现了 70-80%,未来一两年内将达到。目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务仍困难。
OpenAI 正在打造的超级应用将整合 ChatGPT、Codex 和浏览器,成为一个统一的"个人 AGI"——它了解你、与你的目标一致、值得信赖。
OpenAI 正在开发一个自动化 AI 研究员,预计今年秋天推出,将能够像人类研究员一样进行端到端的科研工作。
OpenAI 将计算视为收入中心而非成本中心——目前的问题是"无法足够快地构建计算以满足需求"。
即使管理数十万个 AI 代理,你也不能"放弃责任"。人类能动性和问责制是系统的核心。
AI 行业未能成功讲述技术改善生活的故事。从癌症诊断到创业工具,真实案例大量存在,但没有被广泛传播。
OpenAI 资源有限,必须在两条技术路线中做出选择:Sora 的"世界模型"路线,还是 GPT 推理模型路线。公司选择了后者。
Sora 模型(视频生成)和 GPT 系列(推理模型)实际上是两个完全不同的技术分支。同时推进两个分支在有限的算力下极其困难。OpenAI 并非完全放弃 Sora——相关研究正在机器人学领域继续——但公司清醒地认识到,机器人应用还处于研究阶段,而知识工作领域的 AI 技术将在未来一年迎来真正的爆发。
OpenAI 曾经设想像迪士尼一样,拥有一个核心技术优势,然后将其延伸到多个领域。但 Brockman 指出,Sora 代表的是一条不同的技术分支——基于扩散模型的世界模型路线。而 GPT 系列是另一条分支。算力有限、需求无限,同时追求两条路线几乎不可能。
Brockman 指出一个有趣的现象:在 AI 领域,最大的问题是"机会太多"。任何数学上合理的想法都能产生不错的结果。这证明了深度学习的强大——它不是在记忆数据,而是在理解生成数据的底层规则。
一位物理学家研究某个问题多年无果,交给 OpenAI 的模型,12 小时后得到了解决方案。他说,这是第一次感觉模型在"思考",这个问题可能人类永远无法解决。
OpenAI 正在构建一个统一应用,整合编程、浏览器和 ChatGPT,成为你的"个人 AGI"——了解你、与你目标一致、值得信赖的数字代理人。
1. 编程(Codex):让任何人都能指挥计算机完成任务
2. 浏览器:AI 可以使用网页,你可以监督它的操作
3. ChatGPT:通用对话和知识工作
演讲稿草拟和反馈、小生意点子头脑风暴、设置电脑热角等系统操作(Brockman 自己的使用案例)。
真正的变革在于技术底层的统一:AI 如何获取上下文、如何与世界连接、如何采取行动。OpenAI 正在将之前分散的实现方式整合为一个"AI 层",可以指向不同的应用。
ChatGPT 曾经没有记忆,每次对话都从零开始——就像和陌生人交谈。现在它会记住你们的互动,理解你的偏好。Pulse 功能每天为你推送你可能感兴趣的内容。未来,超级应用会更深入地连接你的邮件、日历、偏好设置,真正了解你,帮你实现目标。
Anthropic 率先推出了整合 Claude、Claude Co-work、Claude Code 的超级应用。OpenAI 承认在"最后一公里可用性"上曾经落后,但现在已经赶上。
12-18 个月前,OpenAI 在编程领域一直有最佳表现,但投入不足的是"最后一公里的可用性"——让 AI 在真实世界场景中真正可用。AI 可以解决编程竞赛问题,但从未见过真实世界的代码库——那些混乱、不完美的代码。大约去年年中,OpenAI 开始认真对待这个问题,组建团队专注于识别所有差距,构建训练环境让 AI 体验真实的软件工程工作。
当主持人问及竞争是否改变了公司内部氛围时,Brockman 分享了一个令人惊讶的答案:"OpenAI 最可怕的时刻其实是在我们发布 ChatGPT 之后。我记得在假期派对上感受到这种'我们赢了'的氛围。我从未有过这种感觉。我一直在想:不,我们是弱者,我们一直都是。"
"Spud" 是一个新的预训练基础模型,整合了约两年的研究成果。它代表的不是单次发布,而是一个加速进步的引擎。
1. 预训练:产生新的基础模型
2. 强化学习:让 AI 应用知识,在不同场景中练习
3. 后训练:最后一公里的行为和可用性优化
Brockman 提到一个有趣的概念——"大模型气味":当模型真的更聪明、更有能力时,你会感觉得到。当你问一个问题,AI 似乎没有理解,那种失望感很强烈。而新一代模型会改变这种体验:你曾经感到沮丧、永远不会用 AI 做的事情,现在你会不假思索地使用它。
1. 提高天花板:解决更开放的问题、更长的时间跨度任务
2. 提高地板:对任何你想做的事情都更有用
公众对 AI 能力的心理模型变化其实相当缓慢。当 AI 为你做了一件神奇的事,你会想"哇,它还能做这个?我从未想象过。"
AI 正进入"起飞"(Takeoff)阶段——技术发展加速,同时可以用 AI 来改进 AI。OpenAI 正在打造"自动化 AI 研究员",预计今年秋天推出。
1. 技术发展加速:因为可以用 AI 让 AI 变得更好
2. 现实世界影响:从配角变成经济增长的主要驱动力
AI 研究员将能够完成 OpenAI 研究科学家从端到端的工作。但不是完全放任不管。就像初级研究员,如果离开太久可能会走弯路。需要资深研究员或有远见的人提供反馈、审查结果、指导方向。
Brockman 认为 AGI 已实现 70-80%,未来一两年内将达到。但目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务却做不到。
我们现在拥有的技术非常参差不齐。在某些任务上绝对是超人的,比如编写代码,AI 可以直接完成。但有一些非常基本的任务是人类能做的,而我们的 AI 仍然很吃力。
"在哪里画线?更多是一种感觉,不是科学。如果五年前有人给我看今天的系统,我会说:'对,这就是我们谈论的 AGI。'但它太不同了,超出了我们的想象。我们需要相应调整心理模型。"
"就我个人的定义,我认为我们接近了。我基本认为我们已经实现了 70-80%。我认为非常明确的是,未来一两年内我们将拥有 AGI——尽管仍然参差不齐,但几乎任何智力任务,关于如何使用你的计算机,AI 都能够完成。"
Brockman 用量子力学的"不确定性原理"来类比 AGI 的定义——你可以争论它,但他的个人判断是几乎已经到了,再多一点就绝对是了。
2025 年 12 月是一个转折点——AI 编程能力从完成 20% 的任务跃升到 80%。Brockman 自己的测试提示词"为我建一个网站"曾经需要 4 小时和多次提示,现在一次就完成了。
"这从'这是个不错的补充'变成了'你必须彻底改造工作流程来适应这些 AI'。"
Brockman 分享了他的个人经历:他几年前学编程时建了一个网站,花了几个月。他的测试提示词以前需要 25 次提示、4 小时才能做好。12 月,一次提示就完成了,而且做得很好。
1. 更好的基础模型
2. 在每个创新轴线上持续推进
Brockman 承认,他曾经认为 Codex 是给程序员用的。但随着技术进步,OpenAI 开始意识到,底层技术主要不是关于代码,而是关于解决问题——管理上下文、整合系统、思考 AI 如何集成和完成工作。如果你有愿景、有目标,你可以描述意图,AI 可以执行。突然间,"Codex 是给程序员用的"变成了"Codex 是给每个人用的"。
未来你将成为管理数十万个 AI 代理的 CEO,但你不能"放弃责任"——必须保持对问题的敏感度,人类能动性和问责制是系统的核心。
"当你让这些自主 AI 代理代表你工作时,你变成了管理数十万个代理船队的 CEO,它们完成你的目标、你的愿景。而你并不完全知道不同事情是如何解决的。"
Brockman 说:"这有好有坏。我们需要承认这些工具的优势,减轻它们的弱点。"关键点是问责制。如果你的代理搞砸了网站,影响了用户,不是代理的错,是你的错。你需要关心。"人类能动性、人类问责制,这是系统的核心部分。"
"创业的民主化绝对要来了。"但更令人兴奋的是"人类雄心天花板的提升"——就像 AlphaGo 的第 37 手,那步人类从未想出的棋,既有创意,又改变了人类对游戏的理解。"这将在每一个领域发生:科学、数学、物理、化学、材料科学、生物学、医疗保健、药物发现。甚至可能在文学、诗歌等其他领域。"
"作为人类意味着在这里,在场,与其他人类连接。我们将看到 AI 释放大量时间,增加人类连接,建立更多的人际纽带。"
算力不是成本中心,而是收入中心——就像雇佣销售员,只要能销售产品,销售员越多,收入越多。OpenAI 建设算力的速度始终跟不上需求。
"我们面临的巨大开支是算力。但你可以不把算力想成成本中心,而是收入中心。就像雇佣销售员——你想雇佣多少销售员?只要能销售产品,有可扩展的销售方式,销售员越多,收入越多。"
OpenAI 不断发现,无法建设足够快的算力来满足需求。现在,OpenAI 必须做出关于发布什么、算力去哪里的非常痛苦的决定。
"从我们发布 ChatGPT 的那一刻起,我记得与团队进行过这次对话,他们说:'我们应该买多少算力?'我说:'全部。'他们说:'不,不,不,真的,我们应该买多少算力?'我说:'无论我们建设多少,我知道我们都无法跟上需求。'从那以后,每年都是这样。"
Dario Amodei(Anthropic CEO)说有些玩家"YOLO"(过于激进),他非常担心。Brockman 不同意:"我们非常深思熟虑,非常清楚地看到即将发生的事情。今年,每个参与者都会感到算力紧张。我们是第一个意识到这一点的。"
"如果你开始担心下行情况——这是非常合理的问题——但赌注不是关于任何一家公司,而是关于整个行业。你相信这项技术可以生产并交付我们看到的大量价值吗?"
Yugo 调查显示,三倍多的美国人预期 AI 对社会的影响是负面的而非正面的。Brockman 认为,AI 行业未能成功帮助人们理解这项技术如何改善他们的生活。
Brockman 分享了他每天听到的具体故事:一个孩子头痛,被拒绝做 MRI。他们用 ChatGPT 研究症状,意识到可以向保险公司争取做 MRI。他们这样做了,结果是脑肿瘤。他们因为使用 ChatGPT 获得正确信息而挽救了孩子的生命。
"但这个故事没有传出去。这发生在很多人的生活中,但故事还没有被讲述。"
Brockman 指出 90 年代的流行文化对 AI 非常负面,担心可能出错。但当人们真正使用 AI,找到效用和价值,他们就会改变看法。
民调显示,公众认为数据中心对环境、家庭能源成本和附近居民生活质量大多是负面的。Brockman 认为有很多错误信息,并承诺 OpenAI 不会推高能源价格。
"关于数据中心肯定有很多错误信息。水使用就是个好例子。如果你看看我们的 Abene 设施——世界上最大的超级计算机之一——它一年的用水量与一个家庭相同。真的可以忽略不计。然而有很多错误信息说数据中心消耗大量用水。"
"在电力方面,我们承诺不会推高人们的能源价格。作为行业,人们正在做出这些承诺,因为改善当地社区非常重要。"
"有真正的理由让老化、过时的电网升级。这实际上对社区有真正的好处。我们在北达科他州看到,人们的费率因为数据中心出现而下降了,因为它帮助改善每个人的公用事业。"
"第一件事是试试这些工具,因为只有通过体验现在存在的 AI,才能真正理解它能为做什么。"
"我认为第一件事是理解技术。我们看到的是,从技术中获得最多的人,带着好奇心接近它,真正尝试在你的工作流程中尝试它,真正克服'空白盒子'的初始障碍。真正发展这种能动感:我可以成为管理者。我可以设定方向。我可以授权。我可以提供监督。"
Brockman 认为 AGI 已实现 70-80%,未来一两年内将达到。但目前的 AI 能力"参差不齐"——某些任务超人类,某些基本任务仍困难。
OpenAI 放弃 Sora 的"世界模型"路线,专注于 GPT 推理模型树。这不是放弃视频生成,而是将研究重心整合到统一技术架构上。
一个整合编程、浏览器和 ChatGPT 的统一应用,将成为你的"个人 AGI"——了解你、与你目标一致、值得信赖。
1100 亿美元的基础设施赌注基于一个信念:算力不是成本中心,而是收入中心。需求永远超过供给。
即使管理数十万个 AI 代理,你也不能"放弃责任"。人类能动性和问责制是系统的核心。
AI 行业未能成功讲述技术改善生活的故事。从癌症诊断到创业工具,真实案例大量存在,但没有被广泛传播。
AI 发展进入加速期——可以用 AI 改进 AI,同时从经济配角变成主要驱动力。
2025 年 12 月是转折点,AI 编程能力从 20% 跃升到 80%。一夜之间,从"不错补充"变成"必须重组工作流程"。
AI 将让任何人都能创业,降低技术门槛,释放人类的创造力和雄心。
带着好奇心尝试,在你的工作流程中真正使用它,发展"管理者思维"——设定方向、授权、监督。