黄仁勋又烧了一把火
文|《中国企业家》记者 闫俊文
编辑|张晓迪
头图来源|视觉中国
2025年5月19日,华为技术团队在开发者平台GitCode发布了一篇技术报告,分享了其昇腾芯片在超大规模MoE模型的推理部署技术。
华为技术团队介绍,在同等参数规模下,昇腾在MoE模型的推理部署性能已全面超越了基于英伟达Hopper架构的推理部署性能,而DeepSeek基于国产芯片的部署方案,性能也已超越英伟达H100系列芯片。
此前的4月份,华为还宣布实现“CloudMatrix 384超节点”技术突破,在算力规模和推理性能上全面超越了英伟达NVL72。
来源:视觉中国
5月19日同天,英伟达CEO黄仁勋亮相中国台湾台北市,在Computex2025大会上发表开幕演讲。演讲中,黄仁勋宣布,将于今年第三季度推出下一代GB300芯片,“英伟达每10年将计算能力扩展约100万倍,我们仍在为此而努力”。
此外,黄仁勋还宣布推出面向企业级Agent开发的RTX Pro,面向开发者和个人的DGX Spark计算机也将在未来几周上线。据黄仁勋描述,RTX Pro在Llama 70B模型上的性能是在H100 HGX的1.7倍,在DeepSeek R1模型上更是提升了4倍。
“不管是x86还是任何系统,都可以在RTX Pro上运行。”黄仁勋说,在未来,企业的IT部门将成为人力资源中心,不过,其管理对象不是人,而是企业的各类Agent AI。
站在AI时代的潮头,黄仁勋正在寻找这场浪潮里的新机遇,他把目光转向个人与企业Agent应用领域。
对于Agent的理解,黄仁勋认为,Agent本质上是数字机器,具备感知、理解和规划能力。在他的眼中,Agent既包括各种数字化产品,也包括了物理形态的机器人,此外,他将具备自动驾驶功能的汽车也纳入了Agent的范畴。
和英伟达一样,在AI竞赛的下半场里,华为也正在押注Agent。
01
新 的 机会 就在 Agent 浪潮 里
黄仁勋在演讲中,回溯了英伟达部署AI的历程。2016年,黄仁勋将第一台DGX-1超级计算机捐给了初创公司OpenAI,OpenAI也不负其望,跑出了GPT、Sora、Codex系列模型,从此掀起了AI浪潮。英伟达也因为AI技术提供芯片等基础设施而成为“宇宙工厂”,其市值一度超过微软、苹果等公司。
黄仁勋在演讲中也提到了DeepSeek,他评价DeepSeek R1对全球AI行业是一个礼物,很多研究员都在关注,DeepSeek转变了人们对AI研究的思路,有非常大的贡献。
在演讲中,黄仁勋发布了面向个人与开发者的DGX Spark计算机与DGX Station工作站,黄仁勋说,DGX计算机是为学生、开发者、研究员等准备的,人工智能云就在身边。
就像当初免费捐赠给大学与研究者使用的CUDA生态,黄仁勋从零建立了这个市场,其一大秘诀就是他所认为的,英伟达不争夺市场份额,而是创造市场。
新的市场机会就在Agent浪潮里,Agent正在成为英伟达的下一个“OpenAI时刻”。
黄仁勋预计,目前,全世界面临劳动力短缺,缺口在3000万到5000万之间,所以,对于企业来说,数字员工不可避免,“企业必须增加新的能力,比如充满活力的人工智能”。
来源:视觉中国
为了将AI技术带到传统企业,兼容传统企业的x86等企业软件系统,黄仁勋此次发布的面向企业级Agent开发的RTX Pro,具备30 PFLOPS FP4 AI性能和3 PFLOPS RTX显示性能,同时配备800GB显存。
在演讲中,黄仁勋强调了未来AI工厂的概念,它的产能是token,“公司将开始讨论上个月生产了多少token,每小时产出多少token,就像你衡量一个传统工厂一样”。
在此背景下,黄仁勋重新定义英伟达,英伟达不是一家科技公司,而是一家AI基础设施公司,就像电力一样。这意味着任何行业、企业与地区都将受到AI浪潮的冲击。
黄仁勋也十分看重物理Agent——机器人,他说,通过学习人类,机器人的能力在物理世界中是无法做到的。必须创造一个虚拟世界,在那里,机器人可以学习如何成为一个好的机器人。
今年3月,英伟达开源了一个名为Isaac Sim的通用人形机器人基础模型,目前,该模型在开源社区已经被下载了6000次;此外,2025年3月18日,英伟达与谷歌DeepMind团队、迪士尼共同开发的机器人物理训练引擎Newton,也将在今年7月开源。在自动驾驶领域,英伟达于1月份就开始布局Thor汽车芯片以及Omniverse平台。
Agent成为趋势的原因是推理AI时代的到来。此前的5月初,在一次公开会议上,黄仁勋说,当前处于推理AI时代。在推理AI时代,Agent能理解任务、自主学习阅读和运用计算器等工具,“未来,我们这代CEO将同时管理生物劳动力与数字劳动力。”
黄仁勋说,AI竞赛是无限游戏,最终的赢家并非技术的发明国,而是能够大规模、高效应用技术的国家。
02
华为与英伟达“暗战”中国大陆市场
传统意义上,英伟达和华为是两条赛道上的企业。英伟达是芯片设计公司,华为是ICT基础设施制造商和智能终端提供商,但如今,两家逐步走上了相同的赛道。
对于华为,黄仁勋在多个场合说过,不可轻视。“如果我们自己退出某个市场,别人一定会迅速补位。比如华为,是全球最具竞争力的科技公司之一,如果我们不做,他们一定会做。”
今年4月,黄仁勋到访北京和上海,后来,外界传言,英伟达计划在上海设立一个研发中心,但英伟达否认了这一说法。英伟达随后回应,GPU的设计修改将不会放在中国大陆进行。
2025年4月,美国政府禁止英伟达在未经出口许可的情况下,向中国市场销售H20芯片,该芯片基于英伟达Hopper技术架构,曾是此前英伟达在美国现有法律框架下,唯一被允许对华销售的高性能人工智能芯片。
美国政府这一轮加码制裁,导致英伟达未来不会再推出Hopper系列芯片。在Computex2025大会上,黄仁勋回应了H20的后续芯片,他答:“不是Hopper系列,因为Hopper已经无法修改了。”
来源:AI生成
在此情况下,华为昇腾系列芯片正在逐步实现国产替代,英伟达在中国大陆获得不了的红利,也在由华为承接。《中国企业家》采访的两家AI基础设施创业者表示,DeepSeek基于华为昇腾系列芯片的部署,让华为获利巨大。
上述创业者透露,目前从客户提需求到拿服务器货源以及软件部署等流程已经十分顺畅,货源充足,并且一些客户往往要求专门部署国产芯片算力。
上述创业者称,华为和英伟达在H100等上一代的芯片差距不是很大,差的是生态和软件,DeepSeek基于英伟达GPU基础之上训练而来,但到了4月底,已在昇腾系列国产芯片上跑出了满血版的效率。
除了芯片领域,与英伟达一样,华为也在Agent方面布局颇多。
在底层芯片技术上,华为有昇腾系列GPU芯片、手机芯片麒麟系列等;在机器人领域,5月12日,华为与优必选科技在深圳正式签署全面合作协议,双方将围绕具身智能和人形机器人领域展开合作。今年3月,华为旗下的哈勃投资了一家名为千寻智能的具身智能机器人公司。此外,明星公司智元机器人的创业团队有不少人是华为背景,如首席技术官彭志辉(稚晖君)曾是华为的“天才少年”,华为公司原副总裁、计算产品线原总裁邓泰华任智元机器人董事长、CEO。
在自动驾驶领域,目前,华为的ADS(华为乾崑高阶智能驾驶辅助系统)合作车企已超过20家,包括赛力斯、长安汽车、北汽、广汽等。
一家华为被投企业的创业者曾告诉《中国企业家》,在美国的芯片出口管制政策下,一些科技大公司已经初步尝试使用国产算力芯片,他评价“效果还不错”。
“当你面对一架破飞机的时候,最好的做法是一边飞行,一边更换零部件,停下来是不可取的。”这位创业者说。
(来源:新浪科技)