英伟达推出Alpamayo 2 Super开源推理模型,助力L4自动驾驶研发

2026年06月01日,13时08分35秒 科技新知 阅读 2 views 次

IT之家 6 月 1 日消息,英伟达今日正式推出了 Alpamayo 2 Super,这是一款拥有 320 亿参数、基于推理能力的视觉 - 语言 - 动作(VLA)模型,进一步丰富了英伟达 Alpamayo 系列开源人工智能模型、仿真框架与物理人工智能数据集,助力企业研发安全的 L4 自动驾驶出租车。

IT之家注意到,伴随该模型发布,英伟达还推出多款全新工具、模型与智能体技能,打通从真实场景数据采集、闭环训练到车载部署的全流程,其中包括包括 NVIDIA AlpaGym、NVIDIA OmniDreams 以及全新的 NVIDIA Omniverse NuRec 模型。

据官方介绍,Alpamayo 2 Super 可免去企业从零搭建自动驾驶核心基础设施的环节,大幅加速自动驾驶车辆研发进程。该模型具备类人的感知、推理与行动能力,同时拥有可解释性,能够满足安全验证与合规监管的相关要求。

为适配道路实车部署的模型训练需求,AlpaGym 提供闭环强化学习平台。而英伟达 OmniDreams 作为可生成逼真场景的世界模型,能够大规模仿真各类罕见、长尾驾驶场景。

为提升开发者效率,英伟达为旗下所有自动驾驶开发工具配套了物理人工智能智能体能力。例如,依托英伟达 Omniverse NuRec 打造的神经重建能力,可基于真实车队行驶场景开展仿真,并批量生成合成训练数据。

英伟达创始人兼首席执行官黄仁勋表示:“Alpamayo 标志着汽车开始具备自主推理能力,不再只是单纯行驶。唯有英伟达能同步提供开源模型、仿真工具、真实场景数据与智能体能力,助力全球自动驾驶出租车生态打造四级自动驾驶能力,让车辆识别极端场景、解释决策逻辑、建立安全信任,并顺利规模化部署至数百万辆汽车。”

依托 Alpamayo 2 Super,英伟达 Alpamayo 系列模型参数规模从 100 亿提升至 320 亿。该模型不再局限于轨迹生成,可在整套驾驶系统中完成推理、规划与执行。其支持多类任务,包括逻辑推理、自动标注、场景理解、模型评估以及大模型知识蒸馏至轻量化模型,为可规模化落地的四级自动驾驶研发与部署奠定基础。

核心特性:

1. 参数规模提升至 3 倍:该模型基于英伟达 Cosmos 打造,相较前代 100 亿参数版本升级至 320 亿参数,在长尾场景下的逻辑推理、三维空间感知与轨迹预测能力全面增强。

2. 全车环视感知:从传统前置摄像头感知升级为 360 度全景环境感知,覆盖车辆前、侧、后方视野,为变道、并线、路口通行等操作提供完整环境信息,提升行驶安全性。

3. 元动作输出:新增元动作输出能力,支持礼让、变道、停车等高层级驾驶动作预判。除行驶轨迹与因果链溯源信息外,模型可输出高阶驾驶决策,为后续规划模块提供依据。

4. 推理式自动标注与二维目标定位:搭载结合二维目标定位的推理式自动标注功能。这款 320 亿参数基础大模型可产出高质量推理标注数据,将标注周期从数月缩短至数日,大幅优化自动驾驶数据链路的成本与效率。

5. 优化因果链与轨迹输出:针对传统模仿学习自动驾驶系统难以应对的罕见、复杂及长尾场景,模型的因果链溯源能力与轨迹生成质量均得到显著提升。

以上升级让 Alpamayo 2 Super 成为英伟达目前功能最强的开源驾驶基础大模型。该模型定位为教师模型,可通过知识蒸馏压缩为轻量化模型,部署在英伟达 DRIVE Hyperion 旗下车载自动驾驶主控芯片 DRIVE AGX Thor 上运行。

从 NVIDIA Alpamayo 1 Nano 和 NVIDIA Alpamayo 1.5 Nano 这类百亿参数模型,到如今 320 亿参数的 Alpamayo 2 Super,整套教师模型完成迭代升级。基于该系列模型搭建的自动驾驶系统,可直接继承高水准的推理与感知能力,各家车企无需重复从零开发。

Alpamayo 系列近期斩获台北国际电脑展(COMPUTEX)最佳选择奖,拿下车载技术与智能座舱类别奖项。自发布以来,该系列模型下载量已接近 40 万次。其开源平台还附带后训练脚本,方便科研人员与开发者结合自有数据集、行驶场景及驾驶策略对模型进行二次适配。

Alpamayo 2 Super 的推理代码预计于今年夏季上线 GitHub,模型权重则将同步发布在 Hugging Face 平台。

英伟达同步推出 NVIDIA AlpaGym,这是一款开源、高算力吞吐的闭环强化学习框架。开环训练仅依托历史录制数据评估模型,单次输出动作;而 AlpaGym 可在英伟达 AlpaSim 中,让模型持续循环完成“决策 - 感知”流程,车辆每一次制动、转向、导航操作都会实时改变仿真环境。

借此,平台能够暴露静态数据集无法发现的累积误差与极端场景故障,让模型在实战化模拟中持续学习。

AlpaGym 基于 AlpaSim microservice 架构与英伟达 Omniverse NuRec 搭建,可高效、规模化开展闭环强化学习,持续突破自动驾驶性能上限。结合物理人工智能自动驾驶数据集,Alpamayo 系列模型可实现从开环预训练到闭环精细化调优的完整训练链路。

英伟达还在 GitHub 开源因果链自动标注流程。该工具可基于原始行车视频,全自动生成具备决策依据与因果关联的标注数据,无需人工参与,为大规模训练具身推理模型提供核心的因果训练数据。

为助力推理型自动驾驶技术研发,英伟达依托 NVIDIA Agent Toolkit 推出多款全新物理人工智能智能体能力,辅助开发者及智能编码程序完成仿真、数据生成、闭环训练等全流程工作,支撑自动驾驶系统的大规模研发与验证。其中包括:依托英伟达 Omniverse NuRec 组件打造的神经重建能力、用于生成逼真驾驶场景的 OmniDreams 能力,以及面向闭环强化学习的 AlpaGym 能力。

英伟达称,包括比亚迪、吉利、极氪、小米以及小马智行等在内的中国主流车企和自动驾驶公司,均已采用或正在基于 NVIDIAHyperion 平台开发智驾。

(来源:新浪科技)



用户登录