特斯拉自动驾驶有何不同?副总裁罕见爆料
据teslarati报道,特斯拉AI/自动驾驶软件副总裁阿肖克·埃卢斯瓦米罕见揭秘了公司AI系统的驾驶学习机制。
他在国际计算机视觉大会发表演讲后,又在社交平台X上发布帖子,分享了特斯拉“端到端”神经网络的细节。
特斯拉端到端系统与竞品的差异
埃卢斯瓦米在帖子中表示,多数其他自动驾驶公司依赖“模块化、多传感器”系统,会将“感知、规划、控制”三个环节拆分开来。
与之相反,他指出特斯拉的方案是将这三个环节整合到一个“持续训练的神经网络”中。“梯度会从控制层一直流向传感器输入层,从而对整个网络进行全局优化,”他解释道。
他提到,这种架构的优势在于“可扩展性”和“类人类推理能力”。结合真实驾驶案例,他举例称特斯拉AI能学习“细微的价值判断”,比如判断“是绕过水坑,还是短暂驶入对向空车道”。
“自动驾驶汽车时刻面临‘迷你电车难题’,” 埃卢斯瓦米写道,“通过学习人类驾驶数据,机器人能掌握与人类价值观一致的判断标准。”
埃卢斯瓦米强调,这套系统还能让AI理解“细微意图”,比如识别路上的动物“是打算过马路,还是停在原地”。而这类细微场景,若通过人工编程实现难度极高。
应对规模、可解释性与仿真三大挑战
埃卢斯瓦米承认,特斯拉AI面临的挑战极为艰巨。其AI系统需处理来自多个摄像头、导航地图和运动学数据的“数十亿个输入数据单元”。
为应对这样的规模,他表示特斯拉全球车队提供了堪称“数据尼亚加拉瀑布”的海量数据——每天产生的驾驶数据量相当于“500年的人类驾驶时长”。随后,复杂的数据处理流程会筛选出“最具价值的训练样本”。
特斯拉还开发了工具,以确保神经网络“可解释、可测试”。公司的“生成式高斯溅射法” 能在毫秒级时间内重建3D场景,且无需复杂设置就能对动态物体建模。
此外,特斯拉的“神经世界模拟器”能让工程师在“高仿真虚拟环境”中安全测试新的驾驶模型,实时生成“高分辨率、符合因果逻辑的响应”。
埃卢斯瓦米在结尾提到,这套架构最终将应用于特斯拉人形机器人Optimus。
“这项工作终将为全人类带来巨大益处,”他表示,并称特斯拉是“当前全球AI领域最理想的工作场所”。
(来源:新浪科技)
