GTC 2026: 黄仁勋的万亿美元豪赌，NVIDIA正在变成什么？

2026年03月24日,13时41分26秒科技新知阅读 37 views 次

文 | 云石乱笔

一万亿的底气与算术

黄仁勋在 GTC 2026 的主题演讲中说出了那句被反复引用的话："Right here where I stand, I see through 2027 at least 1 trillion dollars."

一万亿美元。不是市值，NVIDIA 的市值早就越过了这个门槛，而是营收预期。这个数字足以让在场 3 万名观众屏住呼吸，但稍作拆解就没那么性感了。正如我非常喜欢的科技播客 Moonshots 的分析师 Dave 所指出的：这是跨越两年的订单总额（bookings），需要在合同周期内逐步确认收入，并非某个日历年能实现的数字。Dave 预测 NVIDIA 2026 日历年收入将达到约 3500 亿美元，并将在 2 纳米制程节点上再实现一次翻倍—但增长的天花板不在需求侧，而在台积电。

据 Dave 估计，NVIDIA 已经锁定了台积电 3 纳米产能的约 70%。这也意味着天花板就在那里：你不能卖出你造不出来的芯片。ASML 每年出货的全部光刻系统约七百台，其中最先进的 EUV 设备不过数十台。每一台 EUV 机器的去向都值得追踪，因为它们实际上就相当于印钞机。对此，老黄心知肚明，这也是他拼命向前锁定产能的原因。用 Dave 的话来说："他在竞争到来之前，试图把未来全部锁死。"

这里隐藏着一个反垄断的定时炸弹。当一家公司锁定了全球最先进芯片代工产能的大部分，以至于竞争对手连芯片都造不出来时，监管机构不可能永远视而不见。Groq 的故事就是一个缩影。这家以低延迟推理芯片著:称的公司，其核心工程团队被 NVIDIA 招至麾下，LPU 技术以授权方式纳入 NVIDIA 体系，而背景正是：Groq 无法获得足够的台积电产能来独立扩张。黄仁勋在 GTC 上展示了整合进 Vera Rubin 机架的 Groq 节点，仿佛这是一次双赢的技术融合。但换个角度看，这更像是一场"你要么加入我，要么找不到代工厂"而被迫收编。

Vera Rubin: 从芯片公司到系统帝国

GTC 2026 的硬件主角是 Vera Rubin 平台。它不只是一块新 GPU，它就是 NVIDIA 转型全栈系统公司的宣言。

Vera Rubin NVL72 将 Vera CPU 与 Rubin GPU 组合，配合液冷（支持 45°C 热水）、无线缆设计，号称每瓦 token 产出是上一代的 50 倍。全新的 Kyber 机架采用垂直式设计，每架 144 块 GPU，前部计算、后部 NVLink 互联，彻底抛弃了传统的水平滑入式服务器形态。

Vera CPU 本身也值得注意。NVIDIA 声称其能效是传统 CPU 的两倍，专为 Agentic AI 工作负载设计。这意味着 NVIDIA 不再只是卖加速卡。它现在要卖 CPU、GPU、网络互联（BlueField-4 STX）、存储架构、机架设计，甚至模拟平台（DSX Air）。从芯片到机架到软件栈，NVIDIA 正在把自己变成 AI 基础设施的唯一供应商。

这像极了当年的 IBM 大型机时代：你买我的一切，或者你什么都别买。历史告诉我们，这种模式在短期内极其强大，但长期来看，这个世界不乏聪明的人，总会有人找到绕过去的路。

OpenClaw 与 NemoClaw: NVIDIA 的软件野心

如果说硬件发布是意料之中，那么 NVIDIA 对 OpenClaw 的大力支持则揭示了更深层的战略意图。

OpenClaw 是近期 AI 领域增长最快的开源项目。按照黄仁勋在演讲中展示的数据，它在短短几周内就超越了 Linux 30 年的增长曲线。它是一种全天候运行的无头 AI Agent，通过消息系统与外部世界交互，被视为继 ChatGPT 之后 AI 领域最大的一次"解锁"（unhobbling）。

NVIDIA 推出了 NemoClaw，一套针对企业场景优化的 OpenClaw 技术栈，解决安全性和合规性问题，并与 NVIDIA 硬件深度绑定。与此同时，DGX Spark 等设备被定位为"Agent computer"，即一种全新的计算品类，让最新的开源模型和 AI agent 在本地运行。

这一步棋的精妙之处在于：当 OpenCLAW 成为企业自动化的标准范式，而 NemoCLAW 成为其首选的企业级实现时，NVIDIA 就从"卖铲子的人"升级成了"定义金矿在哪里的人"。播客嘉宾 Salem 将此称为"组织奇点"：一旦企业工作流从人对人转向 Agent 对 Agent 并实现递归自我优化，人类员工的角色将变为监督和异常处理。他估计，任何公司最终只需要当前员工人数的 20%~25%。

这听起来很振奋人心，但也令人不安。当 NVIDIA 既提供运行这些 Agent 的硬件，又提供编排它们的软件框架时，它对企业运营的渗透将超过科技史上任何先例。

物理 AI: 从数据中心到太空

GTC 2026 的另一条主线是"物理 AI"（Physical AI）。

110 台机器人在展厅列队，几乎全球每一家做机器人的公司都在与 NVIDIA 合作。自动驾驶方面，比亚迪、现代、日产、吉利等总计年产 1800 万辆汽车的厂商加入了 NVIDIA 的 robotaxi-ready 平台，加上此前的奔驰、丰田、通用，以及与 Uber 的多城市部署合作。T-Mobile 的加入则暗示了另一个方向：未来的信号塔将变成 NVIDIA Aerial AI RAN 节点。

而最引人注目的，是 Vera Rubin Space One，NVIDIA 与合作伙伴共同开发的太空数据中心计算平台。黄仁勋承认，太空中没有对流和传导散热，只能依靠辐射，"我们得想办法在太空中冷却这些系统"。这回应了围绕戴森群(Dyson Swarm）的更广泛讨论，即在轨道上部署大规模计算设施。

坦率地说，太空数据中心的宣布更像是一个愿景声明而非近期产品。正如 Moonshots 的 Alex 所指出的，辐射冷却在技术上并不是一个未解问题，我们已经在轨道计算的散热和抗辐射设计上积累了数十年经验。真正的瓶颈是经济性和规模化部署。但从叙事角度看，它完美地服务了黄仁勋的核心信息：NVIDIA 要无处不在—地面、云端、轨道。

推理经济学：真正的万亿引擎

在所有的发布中，最值得深思的可能是一个被轻描淡写的转变：推理（inference）已经取代训练（training）成为 AI 计算的主要驱动力。

黄仁勋演讲中展示的一张幻灯片角落里写着"推理爆炸"（inference explosion），这正是支撑万亿美元订单的真正逻辑。NVIDIA 发布了 Dynamo 1.0，一个用于大规模生成式和 Agentic 推理的开源软件。Sam Altman（OpenAI CEO）在同一周透露，从 o1 到 GPT-5.4 Pro，同一困难问题的推理成本下降了约 1000 倍，而这种降幅主要来自推理时计算（inference-time compute）的优化。

思维链式推理（chain-of-thought reasoning）是近年来AI最大的突破。过去 40 年的神经网络研究中，几乎没人关心推理效率，因为训练才是瓶颈，现在情况完全逆转。你可以用推理时计算构建越来越聪明的 AI，而推理优化比训练优化要容易得多。用 Dave 的分析来说，此前几乎没有资源被投入到推理时计算的扩展上，因此仅通过暴力扩展推理时间，就能以近乎"免费"的方式获得数量级的性能提升。

但 Alex 也发出了一个重要警告：这种"免费午餐"终将耗尽。当推理时计算开始主导整体资源消耗时（许多前沿模型已经到了这一步），就必须发现全新的效率提升路径。Sam Altman 暗示 OpenAI 内部可能已经在探索后 Transformer 架构，一种"像 Transformer 超越 LSTM 那样"的跨越。Alex 认为，这种新架构很可能不是回到循环神经网络(RNN)，而是来自某个意想不到的方向，而且很可能不适配当前的 NVIDIA GPU 架构。

这是一万亿美元叙事中最大的隐忧：如果下一代 AI 架构不再需要 GPU 形态的计算，NVIDIA 就会面临当年英特尔（Intel）被 GPU 颠覆时的同样处境。黄仁勋显然意识到了这一点，这也解释了为什么他如此积极地锁定制造产能，收编 Groq，推进全栈整合。他要确保，即使有人设计出更好的芯片，也必须通过他才能把它造出来。

Anthropic 的逆袭与 NVIDIA 的生态赌注

GTC 2026 的时间窗口恰逢另一场地震：Anthropic 在企业市场对 OpenAI 的碾压式超越。根据同期流传的行业数据，Anthropic 在新增企业客户中的模型份额从 40% 飙升至 73%，而 OpenAI 从 60% 跌至 26%。《时代》杂志将 Anthropic 评为最具颠覆性的公司。

这对 NVIDIA 意味着什么？NVIDIA 的策略是做所有人的基础设施，不管上层跑的是 OpenAI、Anthropic、Meta 还是 Google 的模型。但 Anthropic 的崛起揭示了一个微妙的变化：最成功的 AI 公司不是那些试图垂直整合一切的（如 OpenAI 同时做芯片、数据中心、消费者产品、设备），而是那些专注做好一件事并与所有人合作的。Dario Amodei（Anthropic CEO）不设计自己的芯片，不建自己的数据中心，只做 AI 软件，这让他成为每个人都容易合作的伙伴。

讽刺的是，NVIDIA 自身正在走向 OpenAI 式的全面扩张。从 GPU 到 CPU，从网络到存储，从机架设计到软件栈，从企业 AI 到机器人到自动驾驶到太空—"过度扩张"这个企业家的经典陷阱，NVIDIA 正在全速冲向它。

房间里的大象

GTC 2026 刻意回避了几个关键问题。

竞争威胁被轻描淡写。Google 的 TPU 在内部使用中已经接近甚至匹敌 NVIDIA GPU 的水平。Meta 和 Amazon 都在加速自研芯片。埃隆·马斯克宣布了 TerraFab 计划（初始产能 10 万片晶圆/月，目标扩展到 100 万片）。如果这个目标得以实现，将彻底改变半导体制造产业的格局。这些似乎都不是遥远的威胁。

能源瓶颈被技术乐观主义掩盖。Morgan Stanley 报告指出，到 2028 年数据中心面临 13 至 404 GW 的电力缺口。液冷和效率提升只能解决一部分问题。NVIDIA 的回应是"AI 不在乎在哪里上学"，模型可以在一个地方训练，然后在边缘设备上运行。但这回避了一个事实：推理爆炸本身正在制造新的能源需求。

人才市场的残酷现实。同一周，社交媒体上流传的一位美国大学教授的课程数据显示，其计算机科学专业学生的就业率从 2023 年秋季的 89% 暴跌至 2026 年春季的 19%，起薪从 9.4 万美元降至不到 6.1 万。尽管这只是个案而非全国统计，但趋势方向已经清晰：AI 自动化正在吞噬创造它的那批人的工作—而 NVIDIA 的全栈自动化愿景只会加速这一进程。

结语：帝国的边界在哪里？

GTC 2026 展示的不是一家芯片公司的产品发布会，而是一个正在构建中的技术帝国的蓝图。老黄的愿景是 NVIDIA 成为 AI 时代的操作系统，不是软件意义上的操作系统，而是从硅到太空、从芯片到 Agent 工作流的全栈基础设施。

这个愿景在技术上是连贯的，在商业上是诱人的，但在历史上则是异常危险的。每一个试图成为"掌控一切"的科技帝国，无论是IBM 的大型机、微软的桌面垄断，还是Intel 的 x86 统治，最终都被更专注、更灵活的竞争者从侧翼突破。NVIDIA 的护城河是台积电的产能和 CUDA 的生态锁定，但产能可以被新建，生态也可以被新的范式绕过。

真正的问题不是 NVIDIA 能不能达到一万亿美元（以当前的需求和锁定的产能，它大概率能够做到）。真正的问题是，当一万亿美元的基础设施建成之后，如果 AI 的计算范式发生根本性转变，这些投资会变成什么？

黄仁勋赌的是这个转变不会在他锁死一切之前到来。这是一场与时间的赛跑。幸运的是，到目前为止，老黄跑在了前面。

(来源：新浪科技)

2026年 5月
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

关联资讯:

用户登录