AI 战略

Google AI 的历史与未来 桑达尔·皮查伊深度访谈

2025年春夏,市场对Google的判断错得离谱。从Transformer到Gemini,从1800亿美元资本支出到2026年供应瓶颈,Google CEO坦诚分享AI竞赛中的重新崛起。

频道
Stripe
嘉宾
Sundar Pichai
时长
约 69 分钟
观看视频

核心要点

01

Transformer的历史真相

Transformer并非纯粹研究项目,而是为解决翻译和语音识别的实际需求而生。Google在ChatGPT发布前已有LaMDA,但出于质量门槛选择了谨慎推出。

02

速度作为产品哲学

延迟是伟大产品的标志性特征。搜索团队有毫秒级延迟预算,快3毫秒获0.5积分。Gemini Flash拥有Pro 90%能力但更快更高效。

03

Google的AI回归

2025年市场的悲观情绪是错误的。Google早在2016年就以AI-first运营,TPU第七代、全栈能力使其天生适合这个时刻。

04

2026年供应瓶颈

AI竞赛不再是"谁有更多钱",而是"谁能搞到更多内存、电力、许可证"。晶圆产能、电力许可、建设速度成为物理约束。

05

长期主义的回报

Waymo(2010)、量子计算、太空数据中心——这些项目在宣布时看起来"很荒谬",但15年的坚持正在开花结果。

06

2027年企业AI转折

AI在工作流程中的扩散面临提示词技能、数据访问、权限控制等多重挑战。2027年将是企业AI应用的关键转折点。

深度洞察

01

Google AI的历史真相

[00:00:18 - 00:05:16]
核心观点

Transformer并非纯粹的研究项目,而是为解决具体产品需求而生。Google在ChatGPT发布前就已经有了LaMDA这样的产品,但出于对质量的坚持选择了谨慎推出。

深度阐述
Transformer的诞生背景

外界有一个普遍误解:Google发明了Transformer,却让OpenAI将其产品化为ChatGPT。皮查伊澄清了这个说法。Transformer的诞生有非常实际的产品背景:翻译需求驱动——团队当时正致力于改进翻译质量;算力瓶颈——语音识别成功了,但要服务20亿用户,芯片不够——如何解决推理问题?

技术的立即应用

这些技术没有被束之高阁。BERT和MUM立即应用到搜索中,带来了搜索质量的大幅跃升。皮查伊强调:"人们低估了这一点,因为我们如此虔诚地衡量搜索质量。那个时期搜索质量最大的飞跃就是因为BERT和MUM。"

为何没有先发布ChatGPT

答案不是"只做研究不应用",而是有更复杂的考量:LaMDA早已存在——Google内部甚至有人认为LaMDA有了感知能力,这本质上就是早期版本的ChatGPT;质量门槛——Google作为搜索公司,对产品质量有更高标准;安全顾虑——内部版本毒性较大,需要经过RLHF(人类反馈强化学习)处理才能发布。

"Transformer是由我们的研究团队完成的,但他们是受解决产品问题的引导而做出来的。" [00:00:47]
消费互联网的本质

皮查伊将这一切放在更宏大的视角中:"如果你身处消费互联网领域,你总会遇到惊喜。Elad和我在Google时,有Google Video Search。然后YouTube出现了。"Facebook收购Instagram也是如此。"没有人会坐下来说……你不会带着那种戏剧性来看待这些时刻,因为Facebook只是收购了Instagram。"

个人感受
皮查伊对这段历史的反思非常理性。他没有纠结于"错失先机"的叙事,而是将其视为消费互联网生态的正常演进。这种心态正是Google能够在AI竞赛中重新站稳脚跟的关键。
延伸思考
技术史告诉我们,发明者和产品化成功者往往不是同一拨人。Google在AI基础研究上的投入是长期的、系统性的,而ChatGPT更像是一个幸运的产品化时机。重要的是,Google没有因为一时的"落后"而放弃,而是凭借全栈能力快速追赶。
02

速度作为产品哲学

[00:05:17 - 00:12:11]
核心观点

延迟(latency)是伟大产品的标志性特征。Google从搜索到Gmail再到Chrome,一直将速度作为差异化优势。在AI时代,Gemini在TPU上的运行速度延续了这个传统。

深度阐述
速度即质量

"我一直将延迟——为了这个目的我们称之为延迟——视为伟大产品的区别性特征之一。它几乎总是反映了产品的技术基础做得很好。"皮查伊分享了搜索团队的极端实践:毫秒级预算——子团队有毫秒级的延迟预算;激励机制——让系统快3毫秒,获得0.5积分,快5毫秒,1分给延迟预算,1.5分传递给用户;严格审查——有人可能获得30毫秒或10毫秒的预算,但都要经过严格审查。

实际成果

过去五年,搜索延迟改善了30%,而功能性进步巨大。这正是Gemini的策略:Flash模型拥有Pro模型90%的能力,但更快、更高效。

搜索的未来:Agent化

关于搜索的未来,皮查伊描绘了一个Agent化的图景:"很多信息查询在搜索中将是Agent化的。你将完成任务。你将有多个线程在运行。"搜索会消失吗?"搜索会演变为一个Agent管理器,你在其中做很多事情。"

扩张性时刻,非零和游戏

皮查伊强调这是一个扩张性时刻,而非零和游戏:"我觉得这感觉离零和游戏太远了。人们能够做的事情的价值也在某种疯狂的曲线上。"YouTube在TikTok和Instagram之后做得很好。"你越将其视为零和游戏,它看起来就越困难。如果你不创新,它可能变成零和游戏,但只要你处于这些事情的前沿……"

"很多信息查询在搜索中将是Agent化的。你将完成任务。你将有多个线程在运行。" [00:09:08]
个人感受
皮查伊对速度的执着令人印象深刻。在AI时代,很多人关注"能力",但Google依然在平衡"能力"与"速度"。这或许是工程师文化的体现——好的技术不仅要强,还要快。
延伸思考
搜索向Agent的演进,可能意味着"搜索框"这个20年的UI范式最终会被取代。但皮查伊没有固守形式,而是拥抱变革。这种开放性,是Google能够在移动转型后再次成功转型AI的关键。
03

Google的AI回归

[00:12:12 - 00:27:52]
核心观点

2025年市场对Google的悲观情绪是错误的。Google早在2016年就以AI-first的方式运营,TPU的第七代、全栈能力、以及AI对所有业务的杠杆效应,使Google天生适合这个时刻。

深度阐述
为AI时刻而建的公司

"那是一个非常清晰的时刻,'嘿,Overton窗口已经转移了。公司是为那个时刻而建的。垂直整合不是意外,而是非常有意为之的……'"皮查伊回忆道,2016年Google I/O大会就宣布了TPU,并谈论建设AI数据中心。公司已经在以AI-first的方式运作。"我感到,我们在前沿LLM模型方面落后了,但我们在内部拥有所有能力,我们需要执行以满足这个时刻。"

转折点:Gemini 2.5

"我认为真正的模型……人们看到的可能是Gemini 2.5。特别是在多模态方面达到前沿。"皮查伊称赞Google DeepMind团队:他们付出了更高的前期固定成本,但设计了从第一天起就高度多模态的Gemini模型。

动态前沿的竞争

"这是一个令人难以置信的动态前沿。我认为有两三个实验室在相当激烈地相互推动。在任何给定的月份,我们觉得,'噢,太好了。我们做得很好。' '噢,该死。有几件事落后了。'"

关于"AGI-pilled"

有研究者认为Google不如其他实验室那么"AGI-pilled"(相信AGI即将到来)。皮查伊的回应:"我认为我们将资本支出从300亿美元扩大到约1800亿美元……如果你不以某种方式思考曲线,你就不会这样做。""可能因为我们是一家更大的公司,拥有很多产品,在如此多的层面上接触到如此多的人,我们谈论它的语言方式可能不同。"

反驳AGI误解

他反驳了Google不理解AGI的说法:"Demis、Jeff、Ilya、Dario都曾在那里。你好,你过去20年有在关注吗?"

个人的AGI时刻

皮查伊分享了他的几个"感受AGI"的时刻:2012年——Jeff Dean演示最早的Google Brain版本——神经网络识别猫;2014年——与Larry一起参加DARPA挑战赛,看自动驾驶汽车;Demis演示——最早拥有"想象力"的模型版本。但最近最直观的体验是编码:"如果你在编码,给它一个复杂的任务,你从不打开IDE,你在某种Agent管理器世界中,你看到它在做,它有多强大……你可以称之为感受AGI。"

魔法时刻

他讲了一个个人故事:做一个业余项目后,才想起来问"它使用的是什么语言?"——"那是我需要在一切正常运行后才询问它的一个细节。感觉像魔法。"

"我总是感到震惊,你运行一个数据中心几个月,然后你的输出是一个平面文件。就像有一个Word文档,那就是你的模型。" [00:32:41]
个人感受
皮查伊对AGI的态度既务实又开放。他没有炒作,但用1800亿美元的CapEx表态。他强调的是"曲线的斜率"——不是某个特定时间点,而是持续的、多范式的进步。
延伸思考
Google的"不被AGI-pilled"可能恰恰是优势。当竞争对手在炒作"即将到来的AGI"时,Google在默默建设基础设施和产品。这种务实的工程文化,在长期可能比炒作更有效。
04

2026年:供应瓶颈之年

[00:27:53 - 00:41:24]
核心观点

2026年将是供应受限的一年。内存、电力、许可证、晶圆产能——这些物理约束比资本更难突破。这可能导致模型能力分化,但也会推动效率创新。

深度阐述
资本支出的物理约束

Google宣布2026年资本支出在1750-1850亿美元之间。但皮查伊承认:"Google即使想花4000亿美元的资本支出也做不到,因为内存不够,电力不够。"

瓶颈清单

晶圆产能——wafer starts是基本约束;电力与许可——监管环境可能成为约束;建设速度——中国建设速度令人敬畏,美国需要学会快10倍建设;内存——短期内最关键的组件之一。"你几乎必须转变心态,思考在物理世界中快10倍做事需要什么。"

对内存市场的影响

"没有任何领先的记忆公司会戏剧性地提高产能。"短期内存在约束,但会逐渐放松。皮查伊预计这将推动创新:"我们将让这些东西的效率提高30倍。所有这些都在同时发生。"

这是寡头市场吗?

如果算力成为瓶颈,而模型进步越来越依赖自我改进,这是否会形成"音乐椅"游戏——谁能拿到现在的算力?皮查伊部分同意这个框架,但指出一个反直觉的事实:"我刚发布了Gemma 4,它是一个非常好的开源模型……你正在谈论一组可以装在USB记忆棒上的权重。"

安全约束

皮查伊提到了另一个被低估的约束:安全。"这些模型绝对会打破几乎所有现存的软件……有人在告诉我零日漏洞的黑市价格正在下降,因为AI导致供应增长,我认为这是一个非常有趣的市场指标。""我们可能需要更多的协调,而这目前并没有发生。可能会有一个尖锐的时刻。"

约束激发创造力

但皮查伊也看到了积极面:"约束激发创造力。它迫使你经历一个压缩周期,让你变得更高效。"

"Google即使想花4000亿美元的资本支出也做不到,因为内存不够,电力不够。" [00:28:11]
个人感受
皮查伊对物理约束的坦诚令人耳目一新。在AI行业普遍乐观的氛围中,他指出晶圆产能、电力许可这些"无聊"但致命的瓶颈。这种现实主义可能让Google的资本支出决策更加审慎和有效。
延伸思考
2026年的供应瓶颈可能重塑AI竞争格局。拥有 vertically integrated(垂直整合)能力的公司如Google,可能比依赖外包的公司更有韧性。同时,开源模型如Gemma可能因为其"可移植性"而获得战略优势。
05

Google的长期赌注

[00:36:06 - 00:41:24]
核心观点

Google一直在做"在宣布时看起来很荒谬"的长期项目。从Waymo到量子计算,从太空数据中心到Wing无人机配送,这些项目正在进入收获期。

深度阐述
1. 太空数据中心

"我们正处于思考太空数据中心的最早阶段。""如果你以20年的视角,你要把大多数数据中心放在哪里?"

2. 量子计算

皮查伊认为量子计算的最大优势是"模拟自然":"从根本上说,我觉得量子会有优势。我们仍然不了解哈伯工艺(肥料生产)。有许多复杂的……我的本能告诉我,在模拟天气、模拟现实等方面,量子将具有优势。"他强调技术史的模式:"你把东西做到一个规模让它工作,然后人们利用它的创造力找到应用。没人会预测Uber是手机加GPS的结果。"

3. 机器人技术

"Google DeepMind团队正在深入思考机器人技术。我们是一家过早进入机器人领域的公司……但Gemini机器人模型在空间推理等方面是最先进的。"Google正与Boston Dynamics、Agile等公司合作。

4. Wing无人机配送

"我正在扩大Wing的规模,在某个合理的时间段内,4000万美国人将能够使用Wing配送服务。我不是说几年后或类似的时间。"

5. Isomorphic(药物发现)

"专注于以有针对性的方式改进这些模型,以改善药物发现的所有可能步骤……即使你有三期试验等,也能以更高的成功概率到达那里。"皮查伊称赞这是"我在不同生物模型方面见过的最聪明的方法"。

个人感受
皮查伊对长期项目的热情显而易见。这些项目很多始于10-15年前,当时看起来"很荒谬",但Google坚持了下来。这种长期主义在硅谷越来越罕见,而Google似乎是少数几个还保持这种文化的巨头。
延伸思考
太空数据中心是一个令人着迷的想法。随着能源和冷却成本上升,太空的无限冷源和太阳能可能成为解决方案。而量子计算与AI的结合,可能会解锁新的科学发现。这些"Moonshot"项目正是Google区别于其他公司的标志。
06

资本配置的逻辑

[00:41:25 - 00:53:43]
核心观点

Google的资本配置逻辑基于深层技术评估,而非简单的财务回报计算。Waymo的坚持、TPU的持续投资、早期的小额试探加长期承诺,构成了Google独特的资本配置哲学。

深度阐述
Google的优势:早期决策

"在Google,我们的优势之一是有时在周期的非常早期做出这些决定。这几乎可以追溯到我们作为深层技术导向的根源。"皮查伊解释了评估逻辑:早期小额投入——初始资金可以较小;长期承诺——但你要长期承诺;深层技术评估——确保底层技术持续进步。

以量子计算为例

"我们通过什么来评估?我们有关于逻辑量子比特错误率、大型稳定逻辑量子比特阈值的目标,团队是否能达到这些目标?"

Waymo:坚持的案例

为什么Waymo没有像Loon那样被砍掉?皮查伊解释:这是定性和定量结合的决策。"你看Waymo驱动程序——底层技术,软件如何驾驶汽车?在安全性和可靠性方面的进展。""你可能遇到没有进展的阶段,但那时候你需要……你对团队质量有信心,他们会突破这些阶段。"

反向投资

他承认两三年前,当世界对Waymo变得悲观时,Google反而增加了投资。"我现在每天都尽可能坐Waymo上班。这是一种非常神奇的体验。"

关于杠杆

访谈者问:Google是否应该利用杠杆,而不是持有净现金?皮查伊表示:"例如,如果Waymo更早达到这一点,我会更早投资资本。""我一直觉得,如果你对某事感到兴奋并有了信念,你愿意承诺资本来看到它完成。"

TPU预算

现在,计算预算与人力预算同等重要:"我们总是有计算预算……现在它真的非常受限。我至少每周花一个小时思考这个问题,在相当细致的层面上。""稀缺资源是计算,所以你要确保Google宝贵的计算资源被用于最有价值的项目。"

"我一直觉得,如果你对某事感到兴奋并有了信念,你愿意承诺资本来看到它完成。" [00:51:39]
个人感受
皮查伊的资本配置哲学非常"工程师化"——不是财务模型驱动,而是技术评估驱动。这种文化可能让Google在长期技术赌注上比其他公司更有耐心。
延伸思考
在AI时代,计算成为核心资本要素。这改变了传统的资本配置逻辑——以前是人力资本(工程师),现在是算力资本(TPU/GPU)。Google的垂直整合让它在资源配置上有更大灵活性。
07

AI工作流程的扩散

[00:53:44 - 01:09:17]
核心观点

AI在工作流程中的扩散面临多重挑战:提示词技能、数据访问、身份权限控制。2027年将是企业AI应用的关键转折点,但工程师之外的角色采用会更慢。

深度阐述
同心圆式扩散

皮查伊描述了Google内部的"同心圆"式扩散:"有些Google团队正在更深刻地转变……我的一个大任务是如何将其扩散到越来越多的团队。"

Jet Ski(内部版Antigravity)

工程师团队正在"生活"在Agent管理器世界中。但搜索团队是上周才部署的。"在一个大型组织中,我认为变革管理是这项技术扩散的一个困难方面,这对于小公司来说可能很容易。"

访谈者提出的扩散障碍

提示词技能——工程师需要学习如何更好地提示AI;公司特定知识——需要知道使用哪些工具;代码协作——AI生成代码的高更迭率使协作困难;数据访问——Agent需要访问企业数据;权限引擎——谁可以访问什么数据需要重写;角色定义——工程师、产品经理、设计师的边界可能需要合并。

这正是路线图

皮查伊确认这正是Gemini Enterprise和Antigravity团队正在解决的问题:"这正是你所谈论的路线图。字面上说,我们在内部使用它,遇到这些障碍,然后克服它们。这就是正在发布的产品。"

GCP与AI

访谈者称赞了GCP的MCP(Model Context Protocol)集成:"你的AI可以以编程方式与Google Cloud交互……我觉得GCP真的从中受益。它太广泛了,有这么多功能。"皮查伊同意:"AI作为任何事物的编排层……我认为我们已经看到了一些程度,但对于GCP,这肯定是一个巨大的效应。"

产品建议

1. 持久化AI——消费者需要持久的、长期运行的AI任务;2. Google Docs搜索——文档搜索比Gmail难,因为关键词不够独特。皮查伊确认Docs的AI集成将在未来几个月带来"急剧的改进"。

2027年预测

关于"完全自主的财务预测",皮查伊认为:"我确实期望2027年将在某些方面是一个重要的拐点……也许你会用传统方式检查一段时间,但你会转换、交叉。但我想2027年将是一些这些转变相当深刻地发生的一年。"

优势:AI原生公司

"创业公司将有一个优势。更多AI原生的团队,你可能可以通过面试流程等来实现。而对我们来说,我们将有再培训、转型等。"

小项目:后训练改进

皮查伊分享了他昨天花费时间的一件事:"某个人解释他们在后训练方面做的改进,我听着,就像,'噢,这真的会显示为一个很好的跳跃。'""这就是这个时刻的持续力量。"

个人感受
皮查伊对AI扩散挑战的认知非常清晰。他没有炒作"AI将立即改变一切",而是承认企业级应用的复杂性。这种务实态度或许会让Google的企业AI产品更加可靠。
延伸思考
2027年作为企业AI的关键年,与2026年供应瓶颈之年形成有趣的连续性。当供应赶上需求,企业应用场景成熟,AI可能真正开始大规模改变工作方式。但这个过程需要克服的数据访问、权限控制、工作流程重构等障碍,可能比技术本身更具挑战性。

精华收获

🎯

技术史的正名

Transformer不是被束之高阁的研究,而是为解决翻译和语音识别的实际需求而生。Google的AI能力从未真正落后,只是在产品化时机上被OpenAI抢先。全栈能力——从研究到基础设施到产品——才是Google真正的优势。

速度即质量

延迟不是可选项,而是伟大产品的标志性特征。Google从搜索时代延续下来的毫秒级优化文化,在AI时代通过Gemini Flash得到体现。能力与速度的平衡,才是产品成功的关键。

🔧

2026年的供应约束

AI竞赛不再是"谁有更多钱",而是"谁能搞到更多内存、电力、许可证"。这个物理约束可能导致行业格局重新洗牌,但也可能推动开源模型和效率创新。

🌱

长期主义的回报

Waymo(2010)、量子计算、太空数据中心——这些项目在宣布时看起来"很荒谬",但15年的坚持正在开花结果。Google的文化允许小额试探加长期承诺,这种耐心在短期主义盛行的硅谷越来越罕见。

💰

资本配置的技术化

Google的资本配置不是财务模型驱动,而是深层技术评估驱动。TPU分配让资本配置更加显性化,但底层逻辑是一样的:评估底层技术进展,承诺长期支持,在关键转折点加大投入。

🚧

AI扩散的现实障碍

企业AI应用不是"给每个人一个ChatGPT账号"那么简单。数据访问、权限控制、工作流程重构、角色重新定义——这些"软性"障碍比技术本身更具挑战性。2027年可能是关键转折点。

Google文化的回归

最令人欣慰的,可能是Google内部"Googley"乐观主义的回归。那种相信技术可以改变世界、愿意在看似荒谬的想法上长期投入的文化,正在重新浮现。这或许是Google在AI竞赛中最持久的竞争优势。