扎克伯格“开源”上分,但Meta还没到庆功时刻

2024年04月19日,17时17分12秒 科技新知 阅读 6 views 次

作者丨 kiki

编辑 | 山核桃

严格遵照自己日程表的Meta没有人们失望,在上周曝出推出Llama 3 两个版本后,扎克伯格向大模型开源阵营补给了最新的子弹——Llama 3 系列的 8B 和 70B 参数的两个模型。

英伟达研究经理Jim Fan 表示,即将推出的Llama 3-400B+模型将是社区获得GPT-4级别模型的重要里程碑。Abacu.AI的联合创始人Bindu Reddy,也是开源大模型的支持者,则认为,封闭人工智能的时代很有可能结束,Meta用一个「小故事」改变了世界。

Meta是开源大模型的执旗者,在过去一段时间内,随着谷歌、xAI等陆续加入开源阵营,「开源or闭源」这一老生常谈的话题又再度回到舞台之中。不过对Meta来说,放出Llama 3 不是重点,对手的竞争、人才的流失,Meta还远没到「开香槟」的时刻。

扎克伯格“开源”上分,但Meta还没到庆功时刻

对于Llama 3 的表现,扎克伯格在最新一档播客中接受采访时这样评价:“80亿的模型几乎与我们发布的最大版本Llama 2一样强大,因此最小的Llama 3 基本上和最大的Llama 2 一样强大。”

扎克伯格“开源”上分,但Meta还没到庆功时刻

市面上针对Llama 3 的分析已不再少数,「硅基研究室」提供的「省流版」将Llama3的亮点总结为六个方面:

1、在多个基准测试中展现出领先的性能;

2、推理、代码能力明显增强;

3、Meta构建了一个新的、高质量的人类评估集,包括了12个关键场景的 1800 个提示词。

4、数据上,Llama 3 在超15万亿token进行了预训练,数据集是Llama 2 的7倍。

5、通过技术优化提升训练效率。Meta通过数据并行化、模型并行化和管道并行化技术,Llama 3 训练的效率比Llama 2 提高了约三倍。

6、降低了虚假回答的拒绝率,这是因为配备了Llama Guard 2、Code Shield、 CyberSec Eval 2等安全工具。

从上述亮点中不难看出,扎克伯格和Meta显然是有备而来而来,不仅继续秀了scaling laws的魔力,还针对训练效率、虚假回答的拒绝率等科技圈关注的模型能力一整个进行了升级。

扎克伯格“开源”上分,但Meta还没到庆功时刻

当然,除了模型能力外,另一个关键词,还是「开源」。扎克伯克在采访中也再度强调了开源的重要性:“如果未来人工智能系统没有得到广泛部署,而且不是每个人都能使用它们,我会感到失望.....缓解这种情况的最佳方法就是拥有优秀的开源人工智能,使其成为标准,它确保了一个更加公平和平衡的竞争环境。”

过去一段时间内,「开源阵营」的呼声似乎日益强大。前有谷歌开源大模型Gemma,后有马斯克开源 Grok,不久前,在评测榜单上,AI独角兽Cohere的 Command R+ 还跑赢了GPT-4。

不过,目前Llama 3 系列的「超大杯」模型(400B参数),目前还在训练,此前报道或在今年7月推出。Meta表示,未来将在发布具有新功能的多个模型,包括具备多模态能力、多语言交互能力、更长的上下文窗口和更强大的整体能力。不过据The Verge报道,Meta目前尚未最终决定是否开源400B的版本。

在《那些年扎克伯格的错过与过错》一文中,我们曾详细梳理Meta的AI战略。在这场生成式AI浪潮中,之所以说在Meta迅速变革,原因有二:一个是区别于OpenAI等巨头的闭源路线,Meta加入战场的姿态是「开源」,这无疑为其争夺了更多的好感。

另一个原因则是扎克伯格本人对AI的态度,从过去混乱的AI策略转变为整合。关注无论是与微软合作,还是此次发布Meta AI加速与自家的产品生态融合,这都不难看出Meta在积极改变。

但之所以说,Meta还没到庆功时刻,原因也有两点:首先,从宏观来看,Meta想要的还是太多了。一方面需要继续应对自己的AR/VR头显「元宇宙」野心,除此以外,还需要继续投身大模型的基础研发。

其次,则是人才隐忧。Meta在2023 年7 月发表 Llama 2相关研究论文中,其中 68 位作者已至少有10 人离开了Meta。而不少参与Llama 3 的研究人员也离开了 Meta,其中包括负责安全事务的Louis Martin和负责强化学习的Kevin Stone。

不久前,Meta又失去了三位高级AI员工,包括AIGC高级总监Devi Parikh、计算机科学家Erik Meijer和Meta AI 研究科学家Abhishek Das。

一位业内人士此前曾形容,今年的AGI竞赛不是「短跑」,更像是一场「马拉松」。对扎克伯格和他的Meta也是如此,据其采访透露,扎克伯格已经在考虑Llama 4、Llama 5,这会是一场更持久的竞争。

(来源:新浪科技)



用户登录