喧嚣之外,vivo 在AI无人区开辟新赛道

2026年03月27日,12时02分04秒 科技新知 阅读 4 views 次

出品 | 《态度》栏目

作者 | 崔玉贤

编辑 | 丁广胜

当OpenClaw龙虾、大模型、具身智能、智能体等热词以惊人的频率冲刷着社交媒体,FOMO情绪在集体中蔓延。科技公司从软件到硬件,无一不在加速奔跑。
同样面对AI的追问,vivo总裁、首席运营官,vivo中央研究院院长胡柏山没有描绘天马行空的通用机器人未来,也没有放出豪掷百亿的宣言,而是解答了一个关键命题:横亘在物理世界和数字世界的巨大鸿沟如何解决?
喧嚣之外,vivo 在AI无人区开辟新赛道
在今年的博鳌亚洲论坛年会上,vivo给出了自己的答案——感知。在胡柏山看来,“未来十年,智能手机依然是人机交互的绝对核心。”手机从“智能终端”向“智能体终端”的演进,其关键跃迁并非仅仅依赖于云端的“大脑”算力,更取决于设备自身“感知”物理世界的能力。
战略定力,锚定“影像+AI”双核坐标
当行业陷入大模型参数军备竞赛、概念炒作与风口追逐时,vivo却有着冷静的思考和自己的步调。胡柏山在博鳌的演讲中系统性的对外展示了vivo的“影像+AI”战略规划,并明确将“感知”赛道作为新长赛道的投入方向。
他指出,当前AI两大热点——以机器人打醉拳为代表的“具身智能”和以OpenClaw为代表的“数字智能体”——看似繁荣,实则暴露出同一个关键卡点:数字世界与物理世界之间存在着巨大的数据与理解鸿沟。
他以人类的进化为例,人类之所以能够快速进化,是因为人能够将“看到的”转化为数据沉淀并文字记录,而其中最关键的一环就是“用眼睛看见”。
“为什么重视影像赛道?本质上‘影像就是AI的眼睛’,没有看到世界发生什么,也就没有后续的记录和转化。”胡柏山说,“现有大模型大多依赖利用历史数字资产,无法解决真实物理世界的认知问题。”
喧嚣之外,vivo 在AI无人区开辟新赛道
基于这一认知,vivo将影像提升至决定AI未来的战略高度——不再将其视为单纯的手机功能,而是将其打造为AI感知物理世界的核心入口。在这一理念下,vivo在2026年正式成立“感知能力”赛道,融合视觉、听觉、触觉等多模态能力,通过传感器与感知大模型,把物理世界的各类信息转化为机器能读懂的数字信号,为AI提供最真实、最实时的场景数据。
在胡柏山看来,这正是最关键的差异化所在:“未来大模型之间的差异不会太大,真正决定智能体体验好坏的,关键就是场景数据,这是无法替代的。
这也是vivo的核心优势:凭借在AI大模型与影像领域的多年积累,将影像长板与感知体系深度融合,让影像成为连接物理与数字世界的关键纽带,为AI落地提供最真实的场景数据支撑。
Agent Phone,走向增量市场的关键变量
在感知赛道的构建中,vivo始终坚持“端侧为主、云侧协同”的技术路径,不搞无意义的技术堆砌,而是聚焦用户的真实需求,让创新落地到每一个具体的使用场景中。
胡柏山在博鳌的演讲中提到,未来十年,智能手机依然会是人机交互的绝对主导载体。手机将不仅是通讯工具,更是AI落地的“第一现场”,成为物理世界的感知枢纽与个人数字大脑。
但新技术面前,手机也一定会向前演进。胡柏山指出,在影像与AI深度融合的加持下,未来手机将从Smart Phone向Agent Phone形态演进。
喧嚣之外,vivo 在AI无人区开辟新赛道
胡柏山也坦承,当前手机端侧AI仍面临算力与带宽的物理限制。“一是算力,二是带宽,算力再强,但带宽窄的话也起不来。”
针对这一瓶颈,目前行业仍在探索更高带宽与算力的解决方案,包括DRAM和算力芯片一体化、3D DRAM和存算一体等方向。据胡柏山透露,vivo早在两年前就已开始布局端侧专用算力芯片。“我们正在推动(专用算力芯片)在后续旗舰产品中上线,聚焦端侧,算法也在端侧。
这种端侧优先的策略,也体现在产品规划上。胡柏山透露:“3月30号即将发布的vivo X300 Ultra与X300s将率先落地端侧AI,首发相机Agent。以往拍照时,长焦、微距在不同的模式下呈现出来的效果差异很大。用户需要逐一手动设置或提前切换,且不少人不熟悉操作。如今有了相机Agent后,手机可根据拍摄对象、光线、距离,自动推荐它认为最佳的拍摄效果和方式,用户只需要点一下就能够轻松拍出好片,真正做到人人都是摄影师,这也标志着,端侧Agent时代已经到来。”
喧嚣之外,vivo 在AI无人区开辟新赛道
但这只是开始。胡柏山描绘了更完整的Agent生态图景:未来每个方向和场景都会有不同的Agent——相机Agent、相册Agent、会议Agent、出行Agent、游戏Agent……”不同用户、不同场景,都会有专属的手机Agent。
Agent Phone被视为手机行业从存量市场走向增量市场的关键变量。“手机当前是存量市场,做强影像长板,可以持续吸引对影像感兴趣、卷入度高的用户,而要打开增量市场,必须有体验上的颠覆性突破。所以,从SmartPhone向AgentPhone的演进,就是把存量市场变成增量市场。”

胡柏山算了一笔账:中国市场每年新机约2.5亿部,如果Smart Phone转为Agent Phone,有望实现大幅度的规模提升。

“我们希望通过AgentPhone,打开至少未来3-5年的增量市场。”
手机、头显、机器人的“搭积木”式赋能
“感知赛道”的建立,不仅是为了让下一代的手机Agent更“懂”场景,更是vivo面向更长远未来的核心能力投资。胡柏山在演讲中也透露,vivo将围绕这一底层能力,深入布局手机、MR、机器人三大核心产品,以“搭积木”的形式逐级赋能,最终推动"影像+AI"能力普及万物。
MR(混合现实)作为连接物理世界与虚拟世界的重要载体,是vivo感知体系落地的重要场景,也是未来智能生态的关键入口。2025年8月,vivo发布了vivo Vision混合现实头显探索版,成为vivo感知体系在 MR 领域的首次落地。
截至目前,vivo Vision 已在国内开设28个体验店,在东南亚的泰国、马来西亚等国家也完成了布局,累计用户体验人数超过5万人。
胡柏山透露,vivo Vision探索版的使命已经完成,下一代产品将朝着商业化的方向推进,vivo正在攻克内容、生态等卡脖子问题,预计在2027年下半年或2028年初实现MR 产品的商业化落地。
家庭机器人是vivo感知体系未来的终极落地场景。2025年,vivo正式成立机器人 Lab,聚焦机器人的“大脑”和“眼睛”进行核心技术研发,即AI Agent与感知系统,这个逻辑跟我们做手机是一样的,我们希望跟产业链伙伴合作共赢。”胡柏山在接受采访时曾表示。
对于目前人形机器人的进展,胡柏山透露还主要在实验室里。“机器人不是做迭代,而是从零开始。必须搞清楚目标用户是谁,解决什么场景问题。”胡柏山透露,“vivo的机器人前期还是聚焦年轻用户群体。我们的资源还是要聚焦在用户场景下最关键的技术点上做重要突破。”

胡柏山用“沿途下蛋”形容这一长期过程:“所谓沿途下蛋的策略,是指最后的能力可以泛化,可以覆盖更多的场景,但在一开始,只能聚焦在其中一两个场景。举例来说,把宠物喂好,最后可以扩展到收纳等,但一开始只能聚焦一个场景,把这个场景用户体验做到六七十分,在这个过程中,可以提升和泛化,这就是沿途下蛋策略。”

(来源:网易科技)

关于商业化时间线,胡柏山给出了审慎的预期:“今年我们的核心任务就是建认知,把路径规划清晰,包括用户、场景、关键技术,以及各项技术成熟落地时间。”
写在最后:
“我期待,在未来:当人们看到一款设计极其简洁、优雅的产品时,会感叹‘这很vivo’;当人们感受到一种被深刻理解、被细腻在乎的服务时,会说'这很vivo';当人们看到科技在跨越障碍、传递温度时,会由衷地觉得‘这很vivo’。”
这是vivo创始人沈炜在2026年新年致辞中描绘的图景——用100年的时间,让vivo从一个代表品牌的名词,升华为一个象征着“极致、温暖、可靠”的形容词。
从这一角度看,“影像+AI”双核驱动战略的提出,不仅是技术路线的选择,更是vivo品牌内涵的深化。在AI时代,当影像成为AI感知物理世界的“眼睛”,当手机进化为Agent Phone成为“个人数字大脑”,vivo正在用技术的语言诠释“极致、温暖、可靠”的真谛。
正如胡柏山在博鳌演讲的结语:“影像为径,智及万物”。这条路径上,vivo不追风、不冒进,而是以本分之心,笃心笃行,让创新始终回归于人、服务于人。


用户登录