5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

2026年05月11日,10时49分58秒 科技新知 阅读 4 views 次

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

摘要:

创业一年半,余轶南今天看起来紧迫又轻松,这种二元性的对撞让维他显得有些独特,他紧迫的是看到海外具身智能的技术进展,让维他必须加快研发步伐。他轻松的是,维他动力已经率先完成了消费级具身智能产品从技术展示到真实交付的跨越,成为了谈及“消费级具身”就会被首先提到的品牌。

凤凰网科技《浪潮》出品

作者|董雨晴

5月11日,凤凰网科技获悉,具身智能企业维他动力(Vbot)在近期完成了Pre-A轮融资

这笔近5亿元的融资,是消费级具身智能赛道迄今最大的一笔,由东方嘉富、华泰紫金、复星锐正联合领投,凯辉基金、今日资本、高瓴投资等老股东继续押注。

就在几天前,坐在我们面前的维他动力创始人兼CEO余轶南,在谈及融资的时候,并没有表现的特别兴奋。相比钱,他更在意的是另一个变化。

就在采访前一天,首批500台Vbot“大头”超能机器狗已量产下线。5月8日,它们被发往全国各地的终端消费者手中。上海长宁来福士和北京蓝色港湾的首批直营体验店也已开业迎客。

消费级机器人开始真实进入家庭,这个时刻让人既兴奋又紧张。

创业一年多,余轶南把这次创业比作下围棋。他的第一步棋落子极重:不做遥操、不追人形、不刷榜单。一年下来,四足机器狗大头完成了从定义到量产的闭环。第二步棋已在悄悄布局,凤凰网科技了解到,维他动力的人形机器人原型机已在推进中,预计8月将首次亮相。

余轶南告诉我们,过去一年最大的变化,在于他们创造了一个新的品类,让具身智能开始走进家庭。更具象的变化是,越来越多从业者开始被问——“如果你想做消费端,你和Vbot有什么区别?”

这是一次话语权的迁移。

以下是凤凰网科技《浪潮》与维他动力创始人兼CEO余轶南、维他动力联合创始人赵哲伦的对话详情,经编辑发布:

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

谈创业这一年:第一步棋完整地走下来了

凤凰网科技: 创业到现在一年多了,你们碰到的最大困难是什么?

余轶南: 困难挺多的。最开始我们的幻想是,做个机器人应该比造车简单。但事实上,后来发现做个机器人比造车难。

原因在于汽车体积很大,供应链、行业标准都很成熟,它是在一个已经经历了一百年的产业基础之上做Delta(增量)的提升、做局部的创新。但机器人不是,机器人几乎是从零开始。

汽车上有传感器、电池、计算平台、执行机构、电机。机器人也有——像我们的机器狗上有14个电机,14个自由度,有一块非常大的电池(当然跟汽车比还是小),还有大算力的计算平台和传感器。但你要把这么一大堆东西,从一辆车上那么大的体积,塞进一个这么小的身体里,这个对产品开发和工程都造成了巨大的挑战。

所以我们做了很多工作。比如关节模组,又要体积小、又要扭矩密度大、又要轻,这里面有大量的产品和工程创新。你做到这么小以后,还要在这个形态上体现非常强的运动能力,这又需要跟软件算法紧密耦合。我们不是先做硬件然后扔给软件调,而是从模型到硬件一起做迭代,最后才实现现在的表现。

凤凰网科技: 现在这个阶段,你觉得模型能力、工程能力,哪个更重要?哪个是你们更擅长的?

余轶南: 我们在工程和模型能力上都是顶级的,产品对于模型的要求是非常苛刻的。和刷榜单相比,产品上的模型面向用户和开放的使用场景,你预先并不知道考题是什么,而刷榜单都是开卷考试。

今天行业里有一种状态,有点像2012到2015年的AI 1.0时代。大家在刷各种Benchmark。你刷我刷。你说这东西代不代表技术能力?我认为只是部分代表。我工作最早期的时候,做了很多这方面的工作。你发现你刷了一圈分,其实并没有什么用。这些东西并不带来最终产品的价值变现。

我们的思考是,这里面存在一个路径问题,就像下棋,你一开始下在哪儿,在哪个地方做出你的主要阵地、做活,在什么地方去打入别人的阵地。这更多是个路径问题。

凤凰网科技: 那有没有可能别家觉得,这个阶段刷榜单更方便融资,或者说它有别的需求在?

余轶南: 的确是这样子,刷榜单更利于融资。这就是一个选择问题,我们选择的是一条直接一口气干到终端产品落地、跟用户走在一起的路线。即使没刷榜单,我们融资也不错。

但是我觉得今天对这个行业的投资额还不够高。首先,中美之间的差异是巨大的,中国可能融个20亿人民币,北美可能是20亿美金。这是第一个。

第二个,你拿今天的融资额跟其他行业比。现在一个具身智能企业,融资最多就是三五十个亿。但电动汽车的起步是50亿,如果你没有一百亿在账上,就没法干。再往更早看,移动互联网时代,一天烧掉几个亿都正常。这个行业还需要更多的资本加持。

凤凰网科技: 每家花钱的方式不一样。你们融了钱,打算怎么花?

余轶南: 当事情没有很清晰的时候,不要乱花钱。经过一年的探索,技术的确逐渐在变得清晰。特别是数据的技术路线现在在收敛。我们似乎看到了一条通往终局的方案。

早期是遥操,机器人真机遥操,它最直接,但效率很低,不拟人,而且边界无法复制。你没法把人形机器人放到菜市场,每天靠一个人远程遥控去干活,这种方式不work。后来有做夹爪的,戴个手套、装个夹爪去采数据,但这种方式也不够好——夹爪本身不能通向终局。机器人的终局,大家的想象都是灵巧手,因为灵巧手可以做人类能做的所有事情。灵巧手怎么采数据?一直没有被解决。

最近数据采集手套向前推进了一步,但坦率说,这个方式仍然可能不是终局方案。

凤凰网科技: 我们之前听到过一个说法,很多数据采集回来,可用率只有不到5%。另外也有人说,第三人称视角的数据可能没那么重要。

余轶南: 是的,浪费了很多钱。今天比较流行的数据采集方案是第一人称视角。但第三人称视角也很重要,因为从第一性原理出发,人是通过第三人称观测别人干活来学习的,然后在第一人称视角去实践。这两种视角需要组合,我觉得技术的确在收敛。

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

谈产品进化逻辑:从Model S到Model 3,从理想ONE到L9

凤凰网科技: 维他动力马上有大批量机器进家,这个数据可能是别人做不到的,非常关键。现在这批马上交付的C端用户量,在你们预期中吗?

余轶南: 市场的热度超过了我们的预期。

赵哲伦: 发布成功之后,非常多公司立项做了机器狗。

凤凰网科技: 你觉得为什么他们反应这么快?突然大家都对机器狗再次感兴趣了。

赵哲伦: 机器狗这个品类本来在产业里已经有很多年,也很成熟了。具身智能标准形态就两个:人形和四足。行业共识本来就是四足比人形更成熟。但大家之前一直没有找到进入消费端的那个契机。之前四足的产品定义一直差一点东西——它怎么跟人交互?它跟人是什么样的协同关系?之前没人定义清楚。所以四足在之前要么是科研教育,要么是遥控玩具。它给人的认知就是这样。

直到我们去年年底发布产品,等于完成了一轮定义。我认为行业里达成了一定的共识:按这个定义方式,四足有机会做出增量,盘子会变大,不是原来一年就小几万台的那个量。

行业头部对四足的量也非常看好,认为增量就是在消费端的爆发。在这一点上,行业是有一定共识的。

凤凰网科技:所以你们觉得维他自己的护城河是什么?我们看到在人形机器人领域,荣耀突然出来就做了个机器,把前面的成绩全部覆盖了。

赵哲伦: 有三个部分。第一,和用户一起的迭代。初期的用户反馈会极大加速我们产品定义的细化。我们迭代速度非常快,团队研发能力强是一部分,但更重要的原因是真实的用户在给你反馈。这个反馈是外面没有的。友商可能在对标我们的产品,但你最近再来看,OTA之后的产品又不一样了。这些变化是用户带来的。

第二,整体的数据闭环。我们是第一个真的让用户使用具身智能产品、在生活空间里形成数据闭环的公司。过去唯一有的是Tesla的自动驾驶数据,但那是在交通环境。而小区里、园区里的生活空间环境,跟交通环境非常不同。我们四足可以率先获得这些生活空间里的数据闭环,这个数据量远超过今天靠采集方式获得的数据。

第三,组织优势。这一年多我们没有开多产品线,一百来号人完整地跑通了一整条链路的工程闭环——从最早的产品定义、设计,到硬件开发、系统开发、软件算法开发,再到供应链、生产、销售、渠道。这条链路的管理非常完整。这是今天其他大公司的一个小部门,或者其他没有专注做这件事的创业公司,很难直接具备的组织能力

凤凰网科技: 你提到的第一点,“靠用户定义产品”这有点像新能源车现在的状态。

赵哲伦: 更像新能源车的早期阶段。我一直觉得它像两个东西的叠加。

一个是从Model S到Model 3。Model S定义了架构,电池放哪儿、电机放哪儿、传感器放哪儿,基本上把电动车的架构定义完了。但它的缺点就是成本很高。到了Model 3,基本定义都还在,但成本低了很多,把“如无必要”的东西全砍掉了,消费者量级一下子就铺开了。怎么做到的呢?靠Model S和X的用户反馈,靠供应链的协同,从当初接近十万美金,拉到Model 3的三万五到四万美金。这一点我们很像。

另一个是理想ONE到理想L9。理想ONE已经是一款很好的产品,但收到了非常非常多的用户反馈。到了L9,增加的冰箱、后排屏幕、空气循环,全都是根据理想ONE的问题衍生出来的。所以L9的产品定义非常强,ONE还不算。

凤凰网科技: 那在“大头”上有具体的例子吗?

余轶南: 第一个,我们绝大部分的核心零部件走自研。好处是多方面的。成本控制上,我们关节能做到行业普遍成本的一半以下。品质控制上,因为全自研,所有问题都能细粒度地去捕捉,在这个迭代过程中不断优化掉。我们的失效率能做到比其他公司低一到两个数量级。第三是效率,你的开发进度不光靠自己,还依赖供应商的配合程度。我们的自研率高,整个项目的推进效率就大幅提升。一年之内产品能拿出来,如果靠买别人的方案,第一贵,第二良率低,第三配合度问题能把整个项目拖长。

软件算法方面,我们的AI团队人数不算多,我了解过一些友商的团队规模可能数倍于我们。但我们的特点是“专精尖”,每个人都背靠背做事,都是这个领域非常顶级的专家。这带来的是沟通摩擦成本极低,问题分析成本极低。所以比的不仅仅是开发速度,而是从开发、集成、测试、找到问题根因,整个迭代闭环的速度。再往下,背后是人均算力的问题。

一个公司不是看总算力,没用。有的公司总算力非常大,但摊到每个人头上没多少。真正决定AI公司效率的,是人均算力有多大。最好的方式是什么?控制人数,但是释放算力,给每个人足够多的、他能够玩得转的算力。用算力来提升效率,而不是靠堆人数。有的公司人数可能是我们十倍,光AI团队,但他的总算力还没有我们多。你想想这个差别。这就是旧时期和新时代的生产力区别。

凤凰网科技: 你之前说过,如果机器人超越人类极限,你们就要造人形。所以现在马上要准备了?

余轶南: 我们已经开始干了,在搭第一个工程样机的阶段。这事儿一直在我们长期的战略Roadmap上。我还是用下棋来打比方:你的第一步棋,第一个阵地打得差不多了,就可以去第二个阵地开始布点、做一些布局。四足这边,某些工程师的工作已经在收尾了,我们就把一部分人力释放出来,开始做人形机器人的早期规划。

这里面包括整体的初步工业设计、结构堆叠、核心元器件的选型。因为我们在四足上积累了很多经验,对整个架构有了一些升级的思考。比如现在我们的机器狗,架构比较像螃蟹——外骨骼架构。骨骼在外面,内脏在里面被保护起来,结构上更简单。但你发现人其实不是这样的。人的骨骼在内部,外面是脂肪、肌肉和表皮。人是内骨骼,不是外骨骼。

螃蟹是外骨骼。所以对于人形机器人,我们比较倾向于做内骨骼架构。它带来很多优势:外观可以更灵活地调整,自由度更高,身体本身可以做得柔软,摸上去柔软,安全性会大大提升。但它也带来更大的技术挑战——结构强度、结构设计、结构和外观的匹配,都更难。但我觉得这就是“电动拖拉机”和“电动保时捷”的区别。

凤凰网科技: 你做出来之后,会去挑战什么吗?比如速度、运控,或者比赛?

余轶南: 没太想过这个问题。一个好的产品,应该在多个维度上不断演进。现在很多人刷榜,模型刷榜也好,运动会刷名次也好,除了出名以外好像也没别的太大用途。我不是说这没有意义——就跟汽车行业的F1、拉力赛一样,它确实推动技术进步。但我们更看重的还是内核,内核就是技术进步。表象可以是拿了第一,但我们更坚定要做的是推动技术内核往前走。

比如更小的体积里实现更大扭矩、更轻的重量,这里面涉及关节架构、电机架构、减速器的革新。比如算力密度,算力密度做大以后散热怎么做?再比如电池,今天都是集中式的一大块,像砖头一样放在胸腔里,所以很多机器人胸很大。那有没有可能做分布式的电源架构?像人的血管系统和神经系统一样,让能源全身分布,布局更加灵活动态。这些东西带来巨大的技术挑战,但如果你能做到,那一定是更先进的产品。挑战技术的极限,是我们的核心追求。

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

谈竞争壁垒:技术没有壁垒,但组织力有

凤凰网科技: 如果行业里接下来更多企业对消费端开始感兴趣,你怎么应对他们的竞争?

余轶南: 竞争总是存在的,你找不出没有竞争的领域。只不过看你是否比别人先进入战场。至少在今天,行业形成了一个共识:C端,特别是对四足机器人,是更大的战场。我们比其他人更早进入这个战场,而且在引领这个市场的产品定义话语权。现在绝大部分厂商想定义一款四足机器人或者家用具身机器人的时候,不可避免一定会需要跟我们来比较、来参考我们的产品定义。

凤凰网科技: 但是你们磕出来的那些小细节,别家如果挖一个你们的人,不就跟上了吗?

余轶南: 技术存在不断的竞争,需要让自己持续领先,但技术本身并没有壁垒。就像你说的,竞争对手挖一个人,就很快能Get到你在干什么。但真正做实体产品,做Physical AI这条路线的时候,壁垒是多方面的。你不可能挖走一整个团队。你可能只能单点挖某些人,单点的东西并不能构成面状的竞争能力,最多是补充一点局部能力。这种博弈一直存在。我们也会挖别人,我需要补某些方面的能力时,我也会挖。但最后所有挖来的人,都要消化到组织内部,变成组织力的提升。

最后的真正竞争力,是你的组织力的提升、你的效率的提升。你是不是能用别人十分之一的成本或者十分之一的时间,干出别人花很多年才能干出来的事。

凤凰网科技: 在这个过程中,你怎么跟投资人沟通?他们的期待一直在变。

余轶南: 这就看你的定力了。如果你总是跟着市场的情绪走,公司一定会被拉得东倒西歪。你必须有自己的Roadmap和自己的定力。不是说今天火什么我就去讲什么,这样的话你也不会获得投资人的尊重。他投你的时候是风口,风口过去,他会非常焦虑,这种情绪最后会反噬你。

凤凰网科技: 在造机器人这件事上,你们的定力和价值观是什么?

余轶南: 第一天我们就定了一个核心原则:做面向生活空间的机器人。这是最大的原则。

往下拆解,两件事。左边,需要像精品的硬件本体。什么叫做精品的硬件?你看这桌子上全是——MacBook、iPhone、保时捷的跑车、奔驰大G。这些产品不管出货量现在怎么样,但只要做这个品类,全行业都会去对标。它定义了一个时代的产品。

右边,是AI或者软件,这更像是水。它会随着时间演进,你今天看到的跟几个月后看到的就不一样了,它升级了,变更好了。我们给机器狗设计了一整年的延展规划,从一个平台性产品,演化成面向多种场景的应用型产品,把价值越做越好。

在这两个内核之上,再构建技术竞争力。硬件上最重要是能源、动力、算力。算法上,是模型、AI人才、以及数据。应用上,就是刚才班长(赵哲伦)讲的,跟用户不断闭环,把用户声音经过分析判断,形成产品开发的Roadmap。这些事情都是不变量。

在不变量之上,我们再把它形成对外讲的投资融资故事:我过去什么样子,现在什么样子,未来什么样子,为通向未来要做哪些技术储备,开发了哪些先进技术。适当的时候我们也去适当地打一些榜,来证明自己技术的确不错。但逻辑是自下而上一层一层构建的,而不是今天市场上什么东西火、投资领域什么火,我们去讲什么故事。底层逻辑不一样。

凤凰网科技: 你们首批用户,有多少是C端消费者?有多少是行业内的人?

赵哲伦:几乎全都是。行业里的人最多不到10%。

凤凰网科技: 他们的画像是什么样的?

赵哲伦: 最近我们做了一个用户调研,挺有意思的。接近90%都是有孩子的家庭用户。目前的购买主导者80%以上是男性,但在线下体验店的实际观感来看,女性和妈妈们的兴趣也很浓厚,只是我们第一波传播可能更多触达到了男性。

人群定位基本是中产家庭,城市集中在GDP排名前20的城市。前六个城市——北上广深成杭——占了一半,剩下14个城市再占一半。

从公测数据看更有意思。嘴上说喜欢和真用不用,这个骗不了人,我能看到数据。一些偏自媒体、想秀一下的用户,不会长期用,偶尔OTA更新或觉得好玩才会用。长期使用率高的,还是家里有孩子的,而且孩子年纪集中在K12阶段,三、四岁到十二岁。

孩子本身很感兴趣,也确实需要陪伴。中国这一代的孩子都比较无聊,爸妈都忙,陪伴时间少。我们这个东西还真能起到一点陪伴作用。加上AI属性强,能在英语问答、百科问答上帮到孩子。第三,它还能带孩子出门,这不管是孩子喜欢还是家长需要,都能满足。

凤凰网科技:所以它的价格还会更便宜吗?

余轶南: 基本上每年可以降10%到20%,连续五年。因为规模上去,再加上架构进一步优化。你看现在的成本大头,第一个是关节,跟规模强相关。第二是计算平台,跟芯片强相关。每一代新芯片因为集成度更高,能让成本降百分之二三十。传感器基本符合摩尔定律。结构件、电池都是,每年自然就会降价。这几年唯一在涨价的是内存。整体逻辑是这样:当你的量真的大、架构做到足够好,成本会无限接近物料本身的成本——、稀土、铝、PCB板这些原材料。

赵哲伦: 今天这一代,虽然我们卖的价格对C端不算低,但我们的成本压力其实非常大。同等价位的机器狗产品,用料比我们低很多。电池、电机、传感器、算力都低很多。我们相当于是把过去供给高校做科研的产品开发好算法,让消费者“开箱即用”。这是全新的品类,所以初期成本会更高。

5亿融资背后,和余轶南、赵哲伦谈真正的机器人进家 | 浪潮对话

谈组织创新:招聘看学习能力,不控制算力

凤凰网科技: 这个时代大家习惯讲AI native组织,目前你们的工程师已经都不手敲代码了吗?

余轶南: 我们现在已经不手敲了,基本上是全部配AI。我觉得接下来创业本身就不需要那么多人。需要铺人力的,只有那些需要频繁跟人打交道的岗位:门店、客服。在公司内部,这涉及组织形态的根本变化。

过去华为讲“把组织建在流程之上”,先把业务洞察变成流程,然后把所有人放在流程上的节点,每个人有责任、权利和义务。这样跑起来本质是跑流程。

但今天,应该叫“把组织建在AI之上”。所有人变成一个圆桌,中间是AI。所有人跟AI交互,AI帮你识别问题、分发问题。公司变成更大项目制。大家谈好分工,各自干活,通过AI提高效率。它最大的优势是大幅降低管理和交流的摩擦成本。

在The Infinity Machine这本书里,DeepMind的哈萨比斯不断强调一件事,过去动辄上万人、十万人做项目,最大的难点是信息的传递——从上到下逐层扭曲,从下到上逐层偏差。所以你看到有些庞大项目根本干不下去,一干几十年,进展非常缓慢,所有的项目管理工具都失效了。今天把AI放在中间,靠它来Handle信息交互,人和人之间摩擦成本大幅降低。每个单兵的能力,深度和广度都被大大拓宽。

有人会觉得,那就需要纯专家型人才。但我不完全认可。真正的内核是那个人的学习能力。专家也是经过大量项目、成功和失败一点点成长起来的。专家的本质是他学习能力足够强,能快速迭代自己。所以招聘的标准应该是:这个人有没有旺盛的自我生长能力。如果有,三个月他就能超越你的期待。这跟年龄都没关系。

这就是我们的组织观。

凤凰网科技: 你的心态跟一年前刚创业时有变化吗?

余轶南: 我觉得还蛮开心的。你看今天我们做的东西被这个行业认可。不管出货多少,你事实上已经是这个赛道里领军的企业了。所有想干这件事的人——投资人去投别人,用户去买别人的——都会先问第一个问题:“你跟Vbot有什么区别?”

在我们创业之初,我写BP跟投资人讲,投资人问的全是“你跟头部企业有什么区别”。今天没有任何人再问我这个问题了。

反过来,现在别人问的是:“你要做消费端,你跟Vbot有什么区别?”你看,势能就转换过来了。

我觉得做企业最开心的事就是这个——你是不是能持续地引领行业。这跟你融多少钱没关系。我们后面做新产品也是一样,第一目标就是:做出来的一定要是引领行业的东西,而不是Another一个什么。

凤凰网科技: 这样的成功,再来几个你会觉得维他已经非常成功了?

余轶南: 没有终点。做企业跟冲浪一样,一浪要高一浪,这是一个无限游戏。千万不能到“这个事情已经做得差不多”的状态,变成纯粹的运营模式。四足这条线进入跟用户迭代的周期,就像小孩已经生出来,要茁壮成长。另一条线,我们就需要突破新的不可能,让新产品变成行业新的标杆。

凤凰网科技:人形产品的具体规划是怎么样的?

余轶南: 8月份会亮相,年底会有相对成熟的工程形态。从工程到量产还有Gap。我最近确实感受到时间节奏很紧迫——从一些渠道看到的Tesla和Figure的进展,可能比公开市场上大家看到的要更提前。

凤凰网科技: 为什么那么多机器人公司选择了复用成熟的供应链,长出来的产品都一样,他们为什么没有去做全新产品定义的思维?

赵哲伦: 因为VC要求“快”。他们其实是Follow VC的逻辑。我也有过动摇,问过南哥,咱要不要去苏州找某个工厂,直接拿一个人形方案,稍微改个外观贴个标就出来?一两个月就能亮相。

南哥回了我两个意思:第一,太丑了。第二,跟我们价值观不符。那种东西摆样子可以,所有机械臂都是标准件,贴个壳完事儿。但这做的是科研工具,是Demo。行业里真正从设计开始,到硬件结构设计、造型、系统架构定义,这一套完整的从头做的人,事实上不多。所以大家出来的东西才会长得一样。

(来源:新浪科技)



用户登录