4位图灵奖得主布道,2大冠军机器人登台,"AI春晚"果然又高又硬 | 量子位
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
悟道系列模型发布
什么?人形机器人冠军们竟然同台了——
此前荣获半程马拉松长跑冠军天工、拳击冠军宇树G1,首次在智源大会相遇,并且各自还秀上了一波技能。
首先来看宇树,虽然身形小巧,但是打拳动作十分灵活,感觉多日不见技艺精进了不少。

而这边天工机器人迎来了2.0版本,「长腿」运动员已经成为过去式,转而到室内做起家务来,现场为大家准备起甜点来。

没想到天工你,还有另外一幅面孔?!
此外,还遇上了银河通用的机器人在现场取货送货。仅需你的一句语音指令,它就完成这些操作。

如果不看大会名字,可能还以为这又是在哪里举办的机器人盛会。
而这,就是一年一度的“AI春晚”启幕现场,跟往届一样规格拉满~
刚刚官宣再次创业后首次亮相的Bengio,谈到了AI安全,面对当前大模型已经呈现出类生物主体行为,他提出了双重解决方案:
一是研发以无私科学家为原型的非代理性、可信赖人工智能系统,专注于理解世界而非自主行动;二是推动全球协同治理,建立国际监管框架与技术验证机制。

此外,强化学习之父Richard Sutton、姚期智、Joseph Sifakis在内四位图灵奖得主坐镇,Physical Intelligence创始人以及Linux执行董事都来了。
而国内当前最受瞩目的明星公司和明星机器人也都一一亮相。
这边大佬们思想碰撞,那边机器人摩拳擦掌,看点多多,干货也满满。
每次智源大会都会有重磅发布,此次首次亮相的“悟界”系列大模型,它包括四款模型——
- 原生多模态世界模型Emu3;
- 全球首个脑科学多模态通用基础模型见微Brainμ;
- 具身大脑RoboBrain 2.0;
- 全原子微观生命模型OpenComplex2。
可以看到,不仅有世界模型、还有脑科学模型,跨度从宏观世界到微观世界……咱就是说已经有点眼花缭乱了。

悟界系列大模型
此次智源大会一大亮点是重磅发布了“悟界”系列大模型。这是悟界的首次亮相,也是智源正式从悟道到悟界的跨越,此前悟道系列模型已经来到了3.0版本。
对于此次「跨越」,智源研究院院长王仲远表示,这是件水到渠成的的事情,背后源于对于技术趋势的判断:
大模型正在从大语言模型向原生多模态大模型,向世界模型方向演进。悟道的“道”代表了大语言模型系统化方法和路径的探索,而悟界的“界”则代表了虚实世界边界的不断突破。

核心变化在于两个方面:
从数字世界迈向物理世界,过去的“悟道”系列大模型主要利用互联网数据进行训练,从而掌握了理解数字世界知识的能力。而“悟界”的目标是旨在让人工智能能够感知和理解物理世界,首先推进与物理世界的交互,解决实际生产生活中的问题。
从理解宏观世界到探索微观世界,在。
他们认为短期内人形机器人因数据采集、人机交互和环境适应优势是重要载体,长期看随着AGI发展会多样化。对于VLA模型泛化性,虽面临机器人环境复杂等挑战,但通过合成数据、多场景训练等可提升适应性。

能够看到的是,多模态、强化学习、智能体、具身智能都成为了下一代AI发展的关键词。
这离不开产业界和学术界等多方探索,其中智源研究院所在的生态位就很关键。
从成立之初,智源研究院定位就是“做高校做不了,企业不愿意做的事情”。如今这一定位其实得以更加具象体现。
一方面,它承担起基础研究的资源投入和风险。高校拥有顶尖人才,但在大模型时代,基础研究需要庞大的工程团队、计算资源和企业化的运作方式,这是高校难以承担的;而企业这边面临着巨大的资金压力和业务压力,对于风险高的前沿探索往往不愿意参与。
比如就像原生多模态这个方面的探索,与企业为快速落地而先强化语言模型增添模态的方式不同,智源选择在基础架构上实现模态的统一和泛化,挖掘模型的通用性潜力。
而具身智能目前也是在技术路线不收敛的早期阶段,智源的跨本体具身大脑探索也是其中一条高风险路径。
另一方面,智源研究院通过链接产业与高校、以及技术开源的方式来完善整个AI产业的生态。
智源打造的覆盖模型、算法、数据、评测、系统的大模型开源技术体系FlagOpen,截至目前,已开源约200个模型和160个数据集。
其中,模型全球总下载量超6.4亿次,开源数据集下载量近113万次,开源项目代码下载量超140万次。
此次智源大会有30余位AI公司创始人/CEO,100余位全球青年科学家、200余位人工智能顶尖学者和产业专家在此汇聚,也是智源研究院生态影响力的体现。
好了,本届“AI春晚”还在继续。这两天围绕多模态、深度推理、下一代AI路径、Agent智能体、具身智能、AI4S、AI产业、AI安全、AI开源等热门话题,总共有20个论坛180余场报告。
感兴趣的朋友可以继续关注哦~
(来源:量子位)