直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼 | 量子位
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
多模态、3D生成是热门方向
CVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。
比如随手抓住一只何恺明,直接变成追星现场。

在以谷歌/Meta等国际巨头为主导的展区里,中国企业规模创纪录,像腾讯、字节等大展区里面人从众。

展台面前排队体验的技术Demo,妥妥都是技术风向标~

总结下来,有这样几个有意思的发现。
首先,多模态、3D生成是此次论文接收和现场研讨的热门方向,尤其像3D生成是亮点,背后高斯泼溅技术成为此次论文标题出现次数最多的前五关键词之一。
其次,对于基础模型的讨论远比以往更加深入,并且延伸到了产业落地。具身智能、机器人AI在Workshop议程设置中独立出来一个大的板块。
最后,中国企业今年参与得很深度,不过目前还是聚焦在已经成熟商业化的大公司。

除此之外还有哪些亮点,现在就带大家一网打尽。
探展CVPR 2025
CVPR含金量提升
CVPR,视觉领域妥妥的顶会,甚至与其他两位并称的顶会ICCV和ECCV相比,名气还要高那么一点。
每一年被CVPR接收的论文大家都会关注,因为它们一定代表着最最前沿的技术风向。尤其是获得了最佳论文奖项的成果,那就得好好拜读一下。
如果你的论文能被CVPR接收,相当于受到非常大的认可。因此相关从业者一有机会都想冲一波,万一就被录用了呢。
所以这几年CVPR的接收数量逐年递增。今年CVPR共收到13008份有效论文,2878篇论文被接收,最终录用率为22.1%,录用率已经下降不少了,这样导致接收难度陡增。

所以,每一篇CVPR 2025论文含金量都在上升。
多模态成为接收论文标题中的高频词,3D发展速度快、成果亮眼。
有热心网友整理了2878篇论文标题,得出了以下高频词。

多模态这个词位列第一。
此外,3D生成是亮点,背后高斯泼溅技术绕过了一众任务、技术词汇第四高频的关键词。
美国俄勒冈州立大学副教授Fuxin Li曾表示:
这一点在国内也能感知到,尤其在这段时间技术跃迁很快。
像颇受学界关注的Hunyuan 3D,在此次发布会上进行了版本升级以及全面开源。

2.1版本主打的是几何与纹理的双重优化,特别在纹理贴面上有比较大的优化,可达到当前开源3D模型中的SOTA。它的训练代码、模型权重、数据处理流程全部开源,支持一键部署,开发者还可以自主精调。

据腾讯介绍,这是首个全链路开源的工业级3D生成大模型,并且达到了闭源级水平,同时还可适配消费级显卡。
企业参与力度大,探讨主题从技术难题探索拓展至产业应用
如果说论文展示(海报/口头报告)是顶会的一大亮点,那么研讨会(Workshop)则是另外值得关注的部分,来自全球顶尖机构的研究者在此围绕特定主题进行深度碰撞。
今年尤为值得注意的是:主题设计既延续技术纵深探索,又拓展行业生态建设,形成双轮驱动的学术范式。
一方面,去年就在关注的技术领域,今年讨论的话题更加深入。
比如视觉概念研讨会。当前多模态、世界模型讨论正酣,也许按照第一性原理探讨视觉是什么?或许就是解决技术挑战的关键。
另一方面,产业应用中的现实难题,也在这些研讨会中得到讨论。
像3D视觉与理解,从基础的单目深度估计到更复杂的3D场景理解和组合式3D视觉。今年还新增了3D捕获与重建轨道,以及城市建模、数字孪生等更具体的方向,这些都是应对真实世界三维信息获取和建模的需求。
再来看看这次展会,每年都有各种机构来到这里展示他们最新的技术成果。
值得注意的是,这次展台面前人从众的更多都是来自中国玩家的展商。细细扒了一下发现,原来他们的参与度要深度得多。
中国企业深度参与
首先最直接的就是论文接收数,从目前公开的信息来看,企业的接收数都不少,方向也很多元。

今年腾讯表现出众,他们有40+篇被接收论文。其中数十篇论文来自混元团队,覆盖多模态模型长思维链推理、3D生成、图片/视频生成多个领域。优图实验室这边有22篇论文入选,有DeepFake的视频检测、自回归视觉生成、多模态等研究方向。
本次会议的赞助商,其实也有点意思,能够看到企业/机构对于这次会议的支持和重视程度。
从地区分布来看,41家企业或研究机构中,来自美国的共有28家,中国队紧随其后,共有6家。其他国家和地区分布寥寥,各自仅有一家。
尤其在白金赞助这一栏,在一众科技巨头,包括亚马逊、谷歌、苹果等企业之中。中国的腾讯、字节跻身在列,其实足以可见他们对于这次顶会的投入。

这当中,腾讯在今年顶会上的投入比往年都大,不管是从赞助商等级,还是Workshop。
光是业务团队就来了小20个人,这当中还包括了混元、ARC Lab、AI Lab、腾讯视频等业务的技术负责人,在会场近距离分享相关领域的最新技术突破。
比如你可以遇到腾讯混元大模型团队现场Demo展示,用数位板画图,现场屏幕即可完成3D生图。

然后还能遇到ARC Lab高级研究员胡文博,跟你聊聊生成式AI与3D视觉相关。

除此之外,还安排了午餐会、晚宴等活动。
之前啊,就听到那些中国学生说,参加顶会可以蹭到腾讯的邮轮饭、米其林饭,真香啊,这下看来是真的了!

当然腾讯自然带有自己的目的,如果业务团队在现场与学生交谈甚欢,没准直接就完成了boss直聘,毕业之后就直接去腾讯上班。

△腾讯CVPR2025群星未来之夜现场照片
以腾讯为代表的中国企业深度参与顶会的原因,其实也不难看出——
一方面全球加速大模型发展的大环境下,中国企业作为核心参与者,在全球舞台上展示技术实力,体现的是他们技术投入的决心。
以腾讯举例,其投入就非常多。2024年全年,腾讯研发开支约超过706.86亿元,从2018年至今研发投入已达3403亿元。并且还在不断加大AI投资,截至2024年12月,腾讯在全球主要国家和地区专利申请公开总数超过8.5万件,专利授权数量超过4.5万件,全年资本开支为人民币768亿元,同比增加221%,创历史新高。
现场遇到一位高校教授表示,中国公司在大模型领域的发展很快,对于他们带着优秀的成果到现场感到骄傲,腾讯在这个领域的进步让人欣喜。
这一次在学生们心中印象最深的,除了腾讯展台演示的Demo,还有一走进会场就遇到的巨型海报,不知道的还以为(来源:量子位)