喧嚣之外，vivo 在AI无人区开辟新赛道

2026年03月27日,12时02分04秒科技新知阅读 22 views 次

出品 | 《态度》栏目

作者 | 崔玉贤

编辑 | 丁广胜

当OpenClaw龙虾、大模型、具身智能、智能体等热词以惊人的频率冲刷着社交媒体，FOMO情绪在集体中蔓延。科技公司从软件到硬件，无一不在加速奔跑。

同样面对AI的追问，vivo总裁、首席运营官，vivo中央研究院院长胡柏山没有描绘天马行空的通用机器人未来，也没有放出豪掷百亿的宣言，而是解答了一个关键命题：横亘在物理世界和数字世界的巨大鸿沟如何解决？

在今年的博鳌亚洲论坛年会上，vivo给出了自己的答案——感知。在胡柏山看来，“未来十年，智能手机依然是人机交互的绝对核心。”手机从“智能终端”向“智能体终端”的演进，其关键跃迁并非仅仅依赖于云端的“大脑”算力，更取决于设备自身“感知”物理世界的能力。

战略定力，锚定“影像+AI”双核坐标

当行业陷入大模型参数军备竞赛、概念炒作与风口追逐时，vivo却有着冷静的思考和自己的步调。胡柏山在博鳌的演讲中系统性的对外展示了vivo的“影像+AI”战略规划，并明确将“感知”赛道作为新长赛道的投入方向。

他指出，当前AI两大热点——以机器人打醉拳为代表的“具身智能”和以OpenClaw为代表的“数字智能体”——看似繁荣，实则暴露出同一个关键卡点：数字世界与物理世界之间存在着巨大的数据与理解鸿沟。

他以人类的进化为例，人类之所以能够快速进化，是因为人能够将“看到的”转化为数据沉淀并文字记录，而其中最关键的一环就是“用眼睛看见”。

“为什么重视影像赛道？本质上‘影像就是AI的眼睛’，没有看到世界发生什么，也就没有后续的记录和转化。”胡柏山说，“现有大模型大多依赖利用历史数字资产，无法解决真实物理世界的认知问题。”

基于这一认知，vivo将影像提升至决定AI未来的战略高度——不再将其视为单纯的手机功能，而是将其打造为AI感知物理世界的核心入口。在这一理念下，vivo在2026年正式成立“感知能力”赛道，融合视觉、听觉、触觉等多模态能力，通过传感器与感知大模型，把物理世界的各类信息转化为机器能读懂的数字信号，为AI提供最真实、最实时的场景数据。

在胡柏山看来，这正是最关键的差异化所在：“未来大模型之间的差异不会太大，真正决定智能体体验好坏的，关键就是场景数据，这是无法替代的。”

这也是vivo的核心优势：凭借在AI大模型与影像领域的多年积累，将影像长板与感知体系深度融合，让影像成为连接物理与数字世界的关键纽带，为AI落地提供最真实的场景数据支撑。

Agent Phone，走向增量市场的关键变量

在感知赛道的构建中，vivo始终坚持“端侧为主、云侧协同”的技术路径，不搞无意义的技术堆砌，而是聚焦用户的真实需求，让创新落地到每一个具体的使用场景中。

胡柏山在博鳌的演讲中提到，未来十年，智能手机依然会是人机交互的绝对主导载体。手机将不仅是通讯工具，更是AI落地的“第一现场”，成为物理世界的感知枢纽与个人数字大脑。

但新技术面前，手机也一定会向前演进。胡柏山指出，在影像与AI深度融合的加持下，未来手机将从Smart Phone向Agent Phone形态演进。

胡柏山也坦承，当前手机端侧AI仍面临算力与带宽的物理限制。“一是算力，二是带宽，算力再强，但带宽窄的话也起不来。”

针对这一瓶颈，目前行业仍在探索更高带宽与算力的解决方案，包括DRAM和算力芯片一体化、3D DRAM和存算一体等方向。据胡柏山透露，vivo早在两年前就已开始布局端侧专用算力芯片。“我们正在推动（专用算力芯片）在后续旗舰产品中上线，聚焦端侧，算法也在端侧。

这种端侧优先的策略，也体现在产品规划上。胡柏山透露：“3月30号即将发布的vivo X300 Ultra与X300s将率先落地端侧AI，首发相机Agent。以往拍照时，长焦、微距在不同的模式下呈现出来的效果差异很大。用户需要逐一手动设置或提前切换，且不少人不熟悉操作。如今有了相机Agent后，手机可根据拍摄对象、光线、距离，自动推荐它认为最佳的拍摄效果和方式，用户只需要点一下就能够轻松拍出好片，真正做到人人都是摄影师，这也标志着，端侧Agent时代已经到来。”

但这只是开始。胡柏山描绘了更完整的Agent生态图景：未来每个方向和场景都会有不同的Agent——相机Agent、相册Agent、会议Agent、出行Agent、游戏Agent……”不同用户、不同场景，都会有专属的手机Agent。

Agent Phone被视为手机行业从存量市场走向增量市场的关键变量。“手机当前是存量市场，做强影像长板，可以持续吸引对影像感兴趣、卷入度高的用户，而要打开增量市场，必须有体验上的颠覆性突破。所以，从SmartPhone向AgentPhone的演进，就是把存量市场变成增量市场。”

胡柏山算了一笔账：中国市场每年新机约2.5亿部，如果Smart Phone转为Agent Phone，有望实现大幅度的规模提升。

“我们希望通过AgentPhone，打开至少未来3-5年的增量市场。”

手机、头显、机器人的“搭积木”式赋能

“感知赛道”的建立，不仅是为了让下一代的手机Agent更“懂”场景，更是vivo面向更长远未来的核心能力投资。胡柏山在演讲中也透露，vivo将围绕这一底层能力，深入布局手机、MR、机器人三大核心产品，以“搭积木”的形式逐级赋能，最终推动"影像+AI"能力普及万物。

MR（混合现实）作为连接物理世界与虚拟世界的重要载体，是vivo感知体系落地的重要场景，也是未来智能生态的关键入口。2025年8月，vivo发布了vivo Vision混合现实头显探索版，成为vivo感知体系在 MR 领域的首次落地。

截至目前，vivo Vision 已在国内开设28个体验店，在东南亚的泰国、马来西亚等国家也完成了布局，累计用户体验人数超过5万人。

胡柏山透露，vivo Vision探索版的使命已经完成，下一代产品将朝着商业化的方向推进，vivo正在攻克内容、生态等卡脖子问题，预计在2027年下半年或2028年初实现MR 产品的商业化落地。

家庭机器人是vivo感知体系未来的终极落地场景。2025年，vivo正式成立机器人 Lab，聚焦机器人的“大脑”和“眼睛”进行核心技术研发，即AI Agent与感知系统，这个逻辑跟我们做手机是一样的，我们希望跟产业链伙伴合作共赢。”胡柏山在接受采访时曾表示。

对于目前人形机器人的进展，胡柏山透露还主要在实验室里。“机器人不是做迭代，而是从零开始。必须搞清楚目标用户是谁，解决什么场景问题。”胡柏山透露，“vivo的机器人前期还是聚焦年轻用户群体。我们的资源还是要聚焦在用户场景下最关键的技术点上做重要突破。”

胡柏山用“沿途下蛋”形容这一长期过程：“所谓沿途下蛋的策略，是指最后的能力可以泛化，可以覆盖更多的场景，但在一开始，只能聚焦在其中一两个场景。举例来说，把宠物喂好，最后可以扩展到收纳等，但一开始只能聚焦一个场景，把这个场景用户体验做到六七十分，在这个过程中，可以提升和泛化，这就是沿途下蛋策略。”

(来源：网易科技)

关于商业化时间线，胡柏山给出了审慎的预期：“今年我们的核心任务就是建认知，把路径规划清晰，包括用户、场景、关键技术，以及各项技术成熟落地时间。”

写在最后：

“我期待，在未来：当人们看到一款设计极其简洁、优雅的产品时，会感叹‘这很vivo’；当人们感受到一种被深刻理解、被细腻在乎的服务时，会说'这很vivo'；当人们看到科技在跨越障碍、传递温度时，会由衷地觉得‘这很vivo’。”

这是vivo创始人沈炜在2026年新年致辞中描绘的图景——用100年的时间，让vivo从一个代表品牌的名词，升华为一个象征着“极致、温暖、可靠”的形容词。

从这一角度看，“影像+AI”双核驱动战略的提出，不仅是技术路线的选择，更是vivo品牌内涵的深化。在AI时代，当影像成为AI感知物理世界的“眼睛”，当手机进化为Agent Phone成为“个人数字大脑”，vivo正在用技术的语言诠释“极致、温暖、可靠”的真谛。

正如胡柏山在博鳌演讲的结语：“影像为径，智及万物”。这条路径上，vivo不追风、不冒进，而是以本分之心，笃心笃行，让创新始终回归于人、服务于人。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

关联资讯:

用户登录