Google AI 的历史与未来：桑达尔·皮查伊深度访谈

01

Google AI的历史真相

[00:00:18 - 00:05:16]

核心观点

Transformer并非纯粹的研究项目，而是为解决具体产品需求而生。Google在ChatGPT发布前就已经有了LaMDA这样的产品，但出于对质量的坚持选择了谨慎推出。

深度阐述

Transformer的诞生背景

外界有一个普遍误解：Google发明了Transformer，却让OpenAI将其产品化为ChatGPT。皮查伊澄清了这个说法。Transformer的诞生有非常实际的产品背景：翻译需求驱动——团队当时正致力于改进翻译质量；算力瓶颈——语音识别成功了，但要服务20亿用户，芯片不够——如何解决推理问题？

技术的立即应用

这些技术没有被束之高阁。BERT和MUM立即应用到搜索中，带来了搜索质量的大幅跃升。皮查伊强调："人们低估了这一点，因为我们如此虔诚地衡量搜索质量。那个时期搜索质量最大的飞跃就是因为BERT和MUM。"

为何没有先发布ChatGPT

答案不是"只做研究不应用"，而是有更复杂的考量：LaMDA早已存在——Google内部甚至有人认为LaMDA有了感知能力，这本质上就是早期版本的ChatGPT；质量门槛——Google作为搜索公司，对产品质量有更高标准；安全顾虑——内部版本毒性较大，需要经过RLHF（人类反馈强化学习）处理才能发布。

"Transformer是由我们的研究团队完成的，但他们是受解决产品问题的引导而做出来的。" [00:00:47]

消费互联网的本质

皮查伊将这一切放在更宏大的视角中："如果你身处消费互联网领域，你总会遇到惊喜。Elad和我在Google时，有Google Video Search。然后YouTube出现了。"Facebook收购Instagram也是如此。"没有人会坐下来说……你不会带着那种戏剧性来看待这些时刻，因为Facebook只是收购了Instagram。"

个人感受

皮查伊对这段历史的反思非常理性。他没有纠结于"错失先机"的叙事，而是将其视为消费互联网生态的正常演进。这种心态正是Google能够在AI竞赛中重新站稳脚跟的关键。

延伸思考

技术史告诉我们，发明者和产品化成功者往往不是同一拨人。Google在AI基础研究上的投入是长期的、系统性的，而ChatGPT更像是一个幸运的产品化时机。重要的是，Google没有因为一时的"落后"而放弃，而是凭借全栈能力快速追赶。

02

速度作为产品哲学

[00:05:17 - 00:12:11]

核心观点

延迟（latency）是伟大产品的标志性特征。Google从搜索到Gmail再到Chrome，一直将速度作为差异化优势。在AI时代，Gemini在TPU上的运行速度延续了这个传统。

深度阐述

速度即质量

"我一直将延迟——为了这个目的我们称之为延迟——视为伟大产品的区别性特征之一。它几乎总是反映了产品的技术基础做得很好。"皮查伊分享了搜索团队的极端实践：毫秒级预算——子团队有毫秒级的延迟预算；激励机制——让系统快3毫秒，获得0.5积分，快5毫秒，1分给延迟预算，1.5分传递给用户；严格审查——有人可能获得30毫秒或10毫秒的预算，但都要经过严格审查。

实际成果

过去五年，搜索延迟改善了30%，而功能性进步巨大。这正是Gemini的策略：Flash模型拥有Pro模型90%的能力，但更快、更高效。

搜索的未来：Agent化

关于搜索的未来，皮查伊描绘了一个Agent化的图景："很多信息查询在搜索中将是Agent化的。你将完成任务。你将有多个线程在运行。"搜索会消失吗？"搜索会演变为一个Agent管理器，你在其中做很多事情。"

扩张性时刻，非零和游戏

皮查伊强调这是一个扩张性时刻，而非零和游戏："我觉得这感觉离零和游戏太远了。人们能够做的事情的价值也在某种疯狂的曲线上。"YouTube在TikTok和Instagram之后做得很好。"你越将其视为零和游戏，它看起来就越困难。如果你不创新，它可能变成零和游戏，但只要你处于这些事情的前沿……"

"很多信息查询在搜索中将是Agent化的。你将完成任务。你将有多个线程在运行。" [00:09:08]

个人感受

皮查伊对速度的执着令人印象深刻。在AI时代，很多人关注"能力"，但Google依然在平衡"能力"与"速度"。这或许是工程师文化的体现——好的技术不仅要强，还要快。

延伸思考

搜索向Agent的演进，可能意味着"搜索框"这个20年的UI范式最终会被取代。但皮查伊没有固守形式，而是拥抱变革。这种开放性，是Google能够在移动转型后再次成功转型AI的关键。

03

Google的AI回归

[00:12:12 - 00:27:52]

核心观点

2025年市场对Google的悲观情绪是错误的。Google早在2016年就以AI-first的方式运营，TPU的第七代、全栈能力、以及AI对所有业务的杠杆效应，使Google天生适合这个时刻。

深度阐述

为AI时刻而建的公司

"那是一个非常清晰的时刻，'嘿，Overton窗口已经转移了。公司是为那个时刻而建的。垂直整合不是意外，而是非常有意为之的……'"皮查伊回忆道，2016年Google I/O大会就宣布了TPU，并谈论建设AI数据中心。公司已经在以AI-first的方式运作。"我感到，我们在前沿LLM模型方面落后了，但我们在内部拥有所有能力，我们需要执行以满足这个时刻。"

转折点：Gemini 2.5

"我认为真正的模型……人们看到的可能是Gemini 2.5。特别是在多模态方面达到前沿。"皮查伊称赞Google DeepMind团队：他们付出了更高的前期固定成本，但设计了从第一天起就高度多模态的Gemini模型。

动态前沿的竞争

"这是一个令人难以置信的动态前沿。我认为有两三个实验室在相当激烈地相互推动。在任何给定的月份，我们觉得，'噢，太好了。我们做得很好。' '噢，该死。有几件事落后了。'"

关于"AGI-pilled"

有研究者认为Google不如其他实验室那么"AGI-pilled"（相信AGI即将到来）。皮查伊的回应："我认为我们将资本支出从300亿美元扩大到约1800亿美元……如果你不以某种方式思考曲线，你就不会这样做。""可能因为我们是一家更大的公司，拥有很多产品，在如此多的层面上接触到如此多的人，我们谈论它的语言方式可能不同。"

反驳AGI误解

他反驳了Google不理解AGI的说法："Demis、Jeff、Ilya、Dario都曾在那里。你好，你过去20年有在关注吗？"

个人的AGI时刻

皮查伊分享了他的几个"感受AGI"的时刻：2012年——Jeff Dean演示最早的Google Brain版本——神经网络识别猫；2014年——与Larry一起参加DARPA挑战赛，看自动驾驶汽车；Demis演示——最早拥有"想象力"的模型版本。但最近最直观的体验是编码："如果你在编码，给它一个复杂的任务，你从不打开IDE，你在某种Agent管理器世界中，你看到它在做，它有多强大……你可以称之为感受AGI。"

魔法时刻

他讲了一个个人故事：做一个业余项目后，才想起来问"它使用的是什么语言？"——"那是我需要在一切正常运行后才询问它的一个细节。感觉像魔法。"

"我总是感到震惊，你运行一个数据中心几个月，然后你的输出是一个平面文件。就像有一个Word文档，那就是你的模型。" [00:32:41]

个人感受

皮查伊对AGI的态度既务实又开放。他没有炒作，但用1800亿美元的CapEx表态。他强调的是"曲线的斜率"——不是某个特定时间点，而是持续的、多范式的进步。

延伸思考

Google的"不被AGI-pilled"可能恰恰是优势。当竞争对手在炒作"即将到来的AGI"时，Google在默默建设基础设施和产品。这种务实的工程文化，在长期可能比炒作更有效。

04

2026年：供应瓶颈之年

[00:27:53 - 00:41:24]

核心观点

2026年将是供应受限的一年。内存、电力、许可证、晶圆产能——这些物理约束比资本更难突破。这可能导致模型能力分化，但也会推动效率创新。

深度阐述

资本支出的物理约束

Google宣布2026年资本支出在1750-1850亿美元之间。但皮查伊承认："Google即使想花4000亿美元的资本支出也做不到，因为内存不够，电力不够。"

瓶颈清单

晶圆产能——wafer starts是基本约束；电力与许可——监管环境可能成为约束；建设速度——中国建设速度令人敬畏，美国需要学会快10倍建设；内存——短期内最关键的组件之一。"你几乎必须转变心态，思考在物理世界中快10倍做事需要什么。"

对内存市场的影响

"没有任何领先的记忆公司会戏剧性地提高产能。"短期内存在约束，但会逐渐放松。皮查伊预计这将推动创新："我们将让这些东西的效率提高30倍。所有这些都在同时发生。"

这是寡头市场吗？

如果算力成为瓶颈，而模型进步越来越依赖自我改进，这是否会形成"音乐椅"游戏——谁能拿到现在的算力？皮查伊部分同意这个框架，但指出一个反直觉的事实："我刚发布了Gemma 4，它是一个非常好的开源模型……你正在谈论一组可以装在USB记忆棒上的权重。"

安全约束

皮查伊提到了另一个被低估的约束：安全。"这些模型绝对会打破几乎所有现存的软件……有人在告诉我零日漏洞的黑市价格正在下降，因为AI导致供应增长，我认为这是一个非常有趣的市场指标。""我们可能需要更多的协调，而这目前并没有发生。可能会有一个尖锐的时刻。"

约束激发创造力

但皮查伊也看到了积极面："约束激发创造力。它迫使你经历一个压缩周期，让你变得更高效。"

"Google即使想花4000亿美元的资本支出也做不到，因为内存不够，电力不够。" [00:28:11]

个人感受

皮查伊对物理约束的坦诚令人耳目一新。在AI行业普遍乐观的氛围中，他指出晶圆产能、电力许可这些"无聊"但致命的瓶颈。这种现实主义可能让Google的资本支出决策更加审慎和有效。

延伸思考

2026年的供应瓶颈可能重塑AI竞争格局。拥有 vertically integrated（垂直整合）能力的公司如Google，可能比依赖外包的公司更有韧性。同时，开源模型如Gemma可能因为其"可移植性"而获得战略优势。

05

Google的长期赌注

[00:36:06 - 00:41:24]

核心观点

Google一直在做"在宣布时看起来很荒谬"的长期项目。从Waymo到量子计算，从太空数据中心到Wing无人机配送，这些项目正在进入收获期。

深度阐述

1. 太空数据中心

"我们正处于思考太空数据中心的最早阶段。""如果你以20年的视角，你要把大多数数据中心放在哪里？"

2. 量子计算

皮查伊认为量子计算的最大优势是"模拟自然"："从根本上说，我觉得量子会有优势。我们仍然不了解哈伯工艺（肥料生产）。有许多复杂的……我的本能告诉我，在模拟天气、模拟现实等方面，量子将具有优势。"他强调技术史的模式："你把东西做到一个规模让它工作，然后人们利用它的创造力找到应用。没人会预测Uber是手机加GPS的结果。"

3. 机器人技术

"Google DeepMind团队正在深入思考机器人技术。我们是一家过早进入机器人领域的公司……但Gemini机器人模型在空间推理等方面是最先进的。"Google正与Boston Dynamics、Agile等公司合作。

4. Wing无人机配送

"我正在扩大Wing的规模，在某个合理的时间段内，4000万美国人将能够使用Wing配送服务。我不是说几年后或类似的时间。"

5. Isomorphic（药物发现）

"专注于以有针对性的方式改进这些模型，以改善药物发现的所有可能步骤……即使你有三期试验等，也能以更高的成功概率到达那里。"皮查伊称赞这是"我在不同生物模型方面见过的最聪明的方法"。

个人感受

皮查伊对长期项目的热情显而易见。这些项目很多始于10-15年前，当时看起来"很荒谬"，但Google坚持了下来。这种长期主义在硅谷越来越罕见，而Google似乎是少数几个还保持这种文化的巨头。

延伸思考

太空数据中心是一个令人着迷的想法。随着能源和冷却成本上升，太空的无限冷源和太阳能可能成为解决方案。而量子计算与AI的结合，可能会解锁新的科学发现。这些"Moonshot"项目正是Google区别于其他公司的标志。

06

资本配置的逻辑

[00:41:25 - 00:53:43]

核心观点

Google的资本配置逻辑基于深层技术评估，而非简单的财务回报计算。Waymo的坚持、TPU的持续投资、早期的小额试探加长期承诺，构成了Google独特的资本配置哲学。

深度阐述

Google的优势：早期决策

"在Google，我们的优势之一是有时在周期的非常早期做出这些决定。这几乎可以追溯到我们作为深层技术导向的根源。"皮查伊解释了评估逻辑：早期小额投入——初始资金可以较小；长期承诺——但你要长期承诺；深层技术评估——确保底层技术持续进步。

以量子计算为例

"我们通过什么来评估？我们有关于逻辑量子比特错误率、大型稳定逻辑量子比特阈值的目标，团队是否能达到这些目标？"

Waymo：坚持的案例

为什么Waymo没有像Loon那样被砍掉？皮查伊解释：这是定性和定量结合的决策。"你看Waymo驱动程序——底层技术，软件如何驾驶汽车？在安全性和可靠性方面的进展。""你可能遇到没有进展的阶段，但那时候你需要……你对团队质量有信心，他们会突破这些阶段。"

反向投资

他承认两三年前，当世界对Waymo变得悲观时，Google反而增加了投资。"我现在每天都尽可能坐Waymo上班。这是一种非常神奇的体验。"

关于杠杆

访谈者问：Google是否应该利用杠杆，而不是持有净现金？皮查伊表示："例如，如果Waymo更早达到这一点，我会更早投资资本。""我一直觉得，如果你对某事感到兴奋并有了信念，你愿意承诺资本来看到它完成。"

TPU预算

现在，计算预算与人力预算同等重要："我们总是有计算预算……现在它真的非常受限。我至少每周花一个小时思考这个问题，在相当细致的层面上。""稀缺资源是计算，所以你要确保Google宝贵的计算资源被用于最有价值的项目。"

"我一直觉得，如果你对某事感到兴奋并有了信念，你愿意承诺资本来看到它完成。" [00:51:39]

个人感受

皮查伊的资本配置哲学非常"工程师化"——不是财务模型驱动，而是技术评估驱动。这种文化可能让Google在长期技术赌注上比其他公司更有耐心。

延伸思考

在AI时代，计算成为核心资本要素。这改变了传统的资本配置逻辑——以前是人力资本（工程师），现在是算力资本（TPU/GPU）。Google的垂直整合让它在资源配置上有更大灵活性。

07

AI工作流程的扩散

[00:53:44 - 01:09:17]

核心观点

AI在工作流程中的扩散面临多重挑战：提示词技能、数据访问、身份权限控制。2027年将是企业AI应用的关键转折点，但工程师之外的角色采用会更慢。

深度阐述

同心圆式扩散

皮查伊描述了Google内部的"同心圆"式扩散："有些Google团队正在更深刻地转变……我的一个大任务是如何将其扩散到越来越多的团队。"

Jet Ski（内部版Antigravity）

工程师团队正在"生活"在Agent管理器世界中。但搜索团队是上周才部署的。"在一个大型组织中，我认为变革管理是这项技术扩散的一个困难方面，这对于小公司来说可能很容易。"

访谈者提出的扩散障碍

提示词技能——工程师需要学习如何更好地提示AI；公司特定知识——需要知道使用哪些工具；代码协作——AI生成代码的高更迭率使协作困难；数据访问——Agent需要访问企业数据；权限引擎——谁可以访问什么数据需要重写；角色定义——工程师、产品经理、设计师的边界可能需要合并。

这正是路线图

皮查伊确认这正是Gemini Enterprise和Antigravity团队正在解决的问题："这正是你所谈论的路线图。字面上说，我们在内部使用它，遇到这些障碍，然后克服它们。这就是正在发布的产品。"

GCP与AI

访谈者称赞了GCP的MCP（Model Context Protocol）集成："你的AI可以以编程方式与Google Cloud交互……我觉得GCP真的从中受益。它太广泛了，有这么多功能。"皮查伊同意："AI作为任何事物的编排层……我认为我们已经看到了一些程度，但对于GCP，这肯定是一个巨大的效应。"

产品建议

1. 持久化AI——消费者需要持久的、长期运行的AI任务；2. Google Docs搜索——文档搜索比Gmail难，因为关键词不够独特。皮查伊确认Docs的AI集成将在未来几个月带来"急剧的改进"。

2027年预测

关于"完全自主的财务预测"，皮查伊认为："我确实期望2027年将在某些方面是一个重要的拐点……也许你会用传统方式检查一段时间，但你会转换、交叉。但我想2027年将是一些这些转变相当深刻地发生的一年。"

优势：AI原生公司

"创业公司将有一个优势。更多AI原生的团队，你可能可以通过面试流程等来实现。而对我们来说，我们将有再培训、转型等。"

小项目：后训练改进

皮查伊分享了他昨天花费时间的一件事："某个人解释他们在后训练方面做的改进，我听着，就像，'噢，这真的会显示为一个很好的跳跃。'""这就是这个时刻的持续力量。"

个人感受

皮查伊对AI扩散挑战的认知非常清晰。他没有炒作"AI将立即改变一切"，而是承认企业级应用的复杂性。这种务实态度或许会让Google的企业AI产品更加可靠。

延伸思考

2027年作为企业AI的关键年，与2026年供应瓶颈之年形成有趣的连续性。当供应赶上需求，企业应用场景成熟，AI可能真正开始大规模改变工作方式。但这个过程需要克服的数据访问、权限控制、工作流程重构等障碍，可能比技术本身更具挑战性。

Google AI 的历史与未来桑达尔·皮查伊深度访谈

核心要点

Transformer的历史真相

速度作为产品哲学

Google的AI回归

2026年供应瓶颈

长期主义的回报

2027年企业AI转折

深度洞察

Google AI的历史真相

速度作为产品哲学

Google的AI回归

2026年：供应瓶颈之年

Google的长期赌注

资本配置的逻辑

AI工作流程的扩散

精华收获

技术史的正名

速度即质量

2026年的供应约束

长期主义的回报

资本配置的技术化

AI扩散的现实障碍

Google文化的回归