GTC 2026: 黄仁勋的万亿美元豪赌,NVIDIA正在变成什么?

2026年03月24日,13时41分26秒 科技新知 阅读 8 views 次

文 | 云石乱笔

一万亿的底气与算术

黄仁勋在 GTC 2026 的主题演讲中说出了那句被反复引用的话:"Right here where I stand, I see through 2027 at least 1 trillion dollars."

一万亿美元。不是市值,NVIDIA 的市值早就越过了这个门槛,而是营收预期。这个数字足以让在场 3 万名观众屏住呼吸,但稍作拆解就没那么性感了。正如我非常喜欢的科技播客 Moonshots 的分析师 Dave 所指出的:这是跨越两年的订单总额(bookings),需要在合同周期内逐步确认收入,并非某个日历年能实现的数字。Dave 预测 NVIDIA 2026 日历年收入将达到约 3500 亿美元,并将在 2 纳米制程节点上再实现一次翻倍—但增长的天花板不在需求侧,而在台积电。

据 Dave 估计,NVIDIA 已经锁定了台积电 3 纳米产能的约 70%。这也意味着天花板就在那里:你不能卖出你造不出来的芯片。ASML 每年出货的全部光刻系统约七百台,其中最先进的 EUV 设备不过数十台。每一台 EUV 机器的去向都值得追踪,因为它们实际上就相当于印钞机。对此,老黄心知肚明,这也是他拼命向前锁定产能的原因。用 Dave 的话来说:"他在竞争到来之前,试图把未来全部锁死。"

这里隐藏着一个反垄断的定时炸弹。当一家公司锁定了全球最先进芯片代工产能的大部分,以至于竞争对手连芯片都造不出来时,监管机构不可能永远视而不见。Groq 的故事就是一个缩影。这家以低延迟推理芯片著:称的公司,其核心工程团队被 NVIDIA 招至麾下,LPU 技术以授权方式纳入 NVIDIA 体系,而背景正是:Groq 无法获得足够的台积电产能来独立扩张。黄仁勋在 GTC 上展示了整合进 Vera Rubin 机架的 Groq 节点,仿佛这是一次双赢的技术融合。但换个角度看,这更像是一场"你要么加入我,要么找不到代工厂"而被迫收编。

Vera Rubin: 从芯片公司到系统帝国

GTC 2026 的硬件主角是 Vera Rubin 平台。它不只是一块新 GPU,它就是 NVIDIA 转型全栈系统公司的宣言。

Vera Rubin NVL72 将 Vera CPU 与 Rubin GPU 组合,配合液冷(支持 45°C 热水)、无线缆设计,号称每瓦 token 产出是上一代的 50 倍。全新的 Kyber 机架采用垂直式设计,每架 144 块 GPU,前部计算、后部 NVLink 互联,彻底抛弃了传统的水平滑入式服务器形态。

Vera CPU 本身也值得注意。NVIDIA 声称其能效是传统 CPU 的两倍,专为 Agentic AI 工作负载设计。这意味着 NVIDIA 不再只是卖加速卡。它现在要卖 CPU、GPU、网络互联(BlueField-4 STX)、存储架构、机架设计,甚至模拟平台(DSX Air)。从芯片到机架到软件栈,NVIDIA 正在把自己变成 AI 基础设施的唯一供应商。

这像极了当年的 IBM 大型机时代:你买我的一切,或者你什么都别买。历史告诉我们,这种模式在短期内极其强大,但长期来看,这个世界不乏聪明的人,总会有人找到绕过去的路。

OpenClaw 与 NemoClaw: NVIDIA 的软件野心

如果说硬件发布是意料之中,那么 NVIDIA 对 OpenClaw 的大力支持则揭示了更深层的战略意图。

OpenClaw 是近期 AI 领域增长最快的开源项目。按照黄仁勋在演讲中展示的数据,它在短短几周内就超越了 Linux 30 年的增长曲线。它是一种全天候运行的无头 AI Agent,通过消息系统与外部世界交互,被视为继 ChatGPT 之后 AI 领域最大的一次"解锁"(unhobbling)。

NVIDIA 推出了 NemoClaw,一套针对企业场景优化的 OpenClaw 技术栈,解决安全性和合规性问题,并与 NVIDIA 硬件深度绑定。与此同时,DGX Spark 等设备被定位为"Agent computer",即一种全新的计算品类,让最新的开源模型和 AI agent 在本地运行。

这一步棋的精妙之处在于:当 OpenCLAW 成为企业自动化的标准范式,而 NemoCLAW 成为其首选的企业级实现时,NVIDIA 就从"卖铲子的人"升级成了"定义金矿在哪里的人"。播客嘉宾 Salem 将此称为"组织奇点":一旦企业工作流从人对人转向 Agent 对 Agent 并实现递归自我优化,人类员工的角色将变为监督和异常处理。他估计,任何公司最终只需要当前员工人数的 20%~25%。

这听起来很振奋人心,但也令人不安。当 NVIDIA 既提供运行这些 Agent 的硬件,又提供编排它们的软件框架时,它对企业运营的渗透将超过科技史上任何先例。

物理 AI: 从数据中心到太空

GTC 2026 的另一条主线是"物理 AI"(Physical AI)。

110 台机器人在展厅列队,几乎全球每一家做机器人的公司都在与 NVIDIA 合作。自动驾驶方面,比亚迪、现代、日产、吉利等总计年产 1800 万辆汽车的厂商加入了 NVIDIA 的 robotaxi-ready 平台,加上此前的奔驰、丰田、通用,以及与 Uber 的多城市部署合作。T-Mobile 的加入则暗示了另一个方向:未来的信号塔将变成 NVIDIA Aerial AI RAN 节点。

而最引人注目的,是 Vera Rubin Space One,NVIDIA 与合作伙伴共同开发的太空数据中心计算平台。黄仁勋承认,太空中没有对流和传导散热,只能依靠辐射,"我们得想办法在太空中冷却这些系统"。这回应了围绕戴森群(Dyson Swarm)的更广泛讨论,即在轨道上部署大规模计算设施。

坦率地说,太空数据中心的宣布更像是一个愿景声明而非近期产品。正如 Moonshots 的 Alex 所指出的,辐射冷却在技术上并不是一个未解问题,我们已经在轨道计算的散热和抗辐射设计上积累了数十年经验。真正的瓶颈是经济性和规模化部署。但从叙事角度看,它完美地服务了黄仁勋的核心信息:NVIDIA 要无处不在—地面、云端、轨道。

推理经济学:真正的万亿引擎

在所有的发布中,最值得深思的可能是一个被轻描淡写的转变:推理(inference)已经取代训练(training)成为 AI 计算的主要驱动力。

黄仁勋演讲中展示的一张幻灯片角落里写着"推理爆炸"(inference explosion),这正是支撑万亿美元订单的真正逻辑。NVIDIA 发布了 Dynamo 1.0,一个用于大规模生成式和 Agentic 推理的开源软件。Sam Altman(OpenAI CEO)在同一周透露,从 o1 到 GPT-5.4 Pro,同一困难问题的推理成本下降了约 1000 倍,而这种降幅主要来自推理时计算(inference-time compute)的优化。

思维链式推理(chain-of-thought reasoning)是近年来AI最大的突破。过去 40 年的神经网络研究中,几乎没人关心推理效率,因为训练才是瓶颈,现在情况完全逆转。你可以用推理时计算构建越来越聪明的 AI,而推理优化比训练优化要容易得多。用 Dave 的分析来说,此前几乎没有资源被投入到推理时计算的扩展上,因此仅通过暴力扩展推理时间,就能以近乎"免费"的方式获得数量级的性能提升。

但 Alex 也发出了一个重要警告:这种"免费午餐"终将耗尽。当推理时计算开始主导整体资源消耗时(许多前沿模型已经到了这一步),就必须发现全新的效率提升路径。Sam Altman 暗示 OpenAI 内部可能已经在探索后 Transformer 架构,一种"像 Transformer 超越 LSTM 那样"的跨越。Alex 认为,这种新架构很可能不是回到循环神经网络(RNN),而是来自某个意想不到的方向,而且很可能不适配当前的 NVIDIA GPU 架构。

这是一万亿美元叙事中最大的隐忧:如果下一代 AI 架构不再需要 GPU 形态的计算,NVIDIA 就会面临当年英特尔(Intel)被 GPU 颠覆时的同样处境。黄仁勋显然意识到了这一点,这也解释了为什么他如此积极地锁定制造产能,收编 Groq,推进全栈整合。他要确保,即使有人设计出更好的芯片,也必须通过他才能把它造出来。

Anthropic 的逆袭与 NVIDIA 的生态赌注

GTC 2026 的时间窗口恰逢另一场地震:Anthropic 在企业市场对 OpenAI 的碾压式超越。根据同期流传的行业数据,Anthropic 在新增企业客户中的模型份额从 40% 飙升至 73%,而 OpenAI 从 60% 跌至 26%。《时代》杂志将 Anthropic 评为最具颠覆性的公司。

这对 NVIDIA 意味着什么?NVIDIA 的策略是做所有人的基础设施,不管上层跑的是 OpenAI、Anthropic、Meta 还是 Google 的模型。但 Anthropic 的崛起揭示了一个微妙的变化:最成功的 AI 公司不是那些试图垂直整合一切的(如 OpenAI 同时做芯片、数据中心、消费者产品、设备),而是那些专注做好一件事并与所有人合作的。Dario Amodei(Anthropic CEO)不设计自己的芯片,不建自己的数据中心,只做 AI 软件,这让他成为每个人都容易合作的伙伴。

讽刺的是,NVIDIA 自身正在走向 OpenAI 式的全面扩张。从 GPU 到 CPU,从网络到存储,从机架设计到软件栈,从企业 AI 到机器人到自动驾驶到太空—"过度扩张"这个企业家的经典陷阱,NVIDIA 正在全速冲向它。

房间里的大象

GTC 2026 刻意回避了几个关键问题。

竞争威胁被轻描淡写。Google 的 TPU 在内部使用中已经接近甚至匹敌 NVIDIA GPU 的水平。Meta 和 Amazon 都在加速自研芯片。埃隆·马斯克宣布了 TerraFab 计划(初始产能 10 万片晶圆/月,目标扩展到 100 万片)。如果这个目标得以实现,将彻底改变半导体制造产业的格局。这些似乎都不是遥远的威胁。

能源瓶颈被技术乐观主义掩盖。Morgan Stanley 报告指出,到 2028 年数据中心面临 13 至 404 GW 的电力缺口。液冷和效率提升只能解决一部分问题。NVIDIA 的回应是"AI 不在乎在哪里上学",模型可以在一个地方训练,然后在边缘设备上运行。但这回避了一个事实:推理爆炸本身正在制造新的能源需求。

人才市场的残酷现实。同一周,社交媒体上流传的一位美国大学教授的课程数据显示,其计算机科学专业学生的就业率从 2023 年秋季的 89% 暴跌至 2026 年春季的 19%,起薪从 9.4 万美元降至不到 6.1 万。尽管这只是个案而非全国统计,但趋势方向已经清晰:AI 自动化正在吞噬创造它的那批人的工作—而 NVIDIA 的全栈自动化愿景只会加速这一进程。

结语:帝国的边界在哪里?

GTC 2026 展示的不是一家芯片公司的产品发布会,而是一个正在构建中的技术帝国的蓝图。老黄的愿景是 NVIDIA 成为 AI 时代的操作系统,不是软件意义上的操作系统,而是从硅到太空、从芯片到 Agent 工作流的全栈基础设施。

这个愿景在技术上是连贯的,在商业上是诱人的,但在历史上则是异常危险的。每一个试图成为"掌控一切"的科技帝国,无论是IBM 的大型机、微软的桌面垄断,还是Intel 的 x86 统治,最终都被更专注、更灵活的竞争者从侧翼突破。NVIDIA 的护城河是台积电的产能和 CUDA 的生态锁定,但产能可以被新建,生态也可以被新的范式绕过。

真正的问题不是 NVIDIA 能不能达到一万亿美元(以当前的需求和锁定的产能,它大概率能够做到)。真正的问题是,当一万亿美元的基础设施建成之后,如果 AI 的计算范式发生根本性转变,这些投资会变成什么?

黄仁勋赌的是这个转变不会在他锁死一切之前到来。这是一场与时间的赛跑。幸运的是,到目前为止,老黄跑在了前面。

(来源:新浪科技)



用户登录