赛道Hyper | Meta自研推理芯片:今年完成部署

2024年02月04日,04时32分22秒 美国动态 阅读 17 views 次

赛道Hyper | Meta自研推理芯片:今年完成部署

周源

02-03 20:20

好事连连。

作者:周源/华尔街见闻

在Meta创下美股史上单日最高涨幅纪录的同时,该公司一份内部文件曝光:Meta计划今年在该公司的数据中心部署新版自研定制芯片(ASIC),以支持其AI业务的进一步发展。

在过去的2023年,这家公司在推动AI和元宇宙的愿景方面,“取得了很大进展”,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在其财报会议上说。

Meta发言人证实了这项计划并称,其自研芯片将与Meta购买的现成的英伟达GPU协同以增强AI算力,共同夯实该公司的AI基础设施能力。

这位发言人表示,Meta自研芯片将在2024年投产,以此降低AI加速卡采购成本,减少对英伟达的依赖。

公开信息显示,Meta的这款ASIC在内部被称为“Artemis”,主要性能集中在推理领域,技术开发基于2023年宣布的第二代内部芯片产品线。

北美时间2月1日,Meta公布了截至2023年12月31日的2023财年第四财季业绩:各项财务数据大幅超出此前市场预期;同时,Meta对今年一季度的经营业绩也做出了超出预期的乐观预估,故而Meta股价在2月2日(北京时间)录得美股史上最大单日涨幅纪录。

自研推理ASIC以降低成本

从2022年12月22日OpenAI发布ChatGPT-3.5以来,推进GenAI(生成式人工智能:Genetic Artificial Intelligence)技术应用所需的AI芯片成本、基础设施能力和能耗,成为科技公司资金的“虹吸器”,在一定程度上抵消了围绕这项技术的显性或隐性收益。

故而,包括微软、亚马孙和谷歌英特尔AMD高通等等在内的美国科技巨头,无不加入自研AI芯片的大军,Meta也是其中的一员。

英伟达H100的价格已经飙升至2.5万-3万美元,这意味着ChatGPT单次查询的成本将提高至约0.04美元。即使只维持ChatGPT的基本运作,每年也需要约160亿美元成本。

Meta的“Artemis”芯片和其前代产品一样,也只能执行“推理”负载工作,模型被要求使用它们的算法做出排名判断,并对用户提示做出回应。这家曾于2023年分享其首代Meta训练和推理加速器(MTIA)项目的相关细节,但此后这个项目再未有新进展披露。

Meta公司发言人在一份声明中表示,“我们认为内部开发的AI加速器与商用GPU具有高度互补性,可以在Meta特定工作负载上提供性能和效率的最佳组合。”

据马克·扎克伯格在今年1月发布的视频信息,Meta计划在2024年底前拥有大约35万颗来自英伟达的旗舰AI芯片H100,这是英伟达研发的当前全球最受欢迎的用于人工智能工作负载的服务器GPU。扎克伯格强调,与自研版全新AI芯片和其他潜在供应商的AI芯片累加,Meta将累积等效于60万颗H100 AIGPU的算力。

在视频中,扎克伯格透露了Meta人工智能计划的更新路线图:Meta将围绕即将推出的Llama 3构建全新的Meta AI路线图,目前正在推进Llama 3的AI训练。Llama 3将与Google最近发布的Gemini模型和OpenAI的GPT-4、以及即将推出的GPT-5模型竞争。

关于Llama 3的最早传闻出现在2023年8月,但Meta从未正面承认这项全新的GenAI产品的技术迭代,直到今年1月扎克伯格发布的这则视频。

到了今年1月30日,扎克伯格在一条推特中直接提到了Llama 3。行业认为Meta透露2024年部署自研的“Artemis”AI推理芯片与Llama 3有关。

扎克伯格暗示,Llama 3很可能是Meta的第一个支持多媒体和语音输入的多模式模型。Llama 2则只是一个聊天机器人,用户只能在其中提出问题并编写故事。

目前,Meta仍未正面透露Llama 3的发布时间,或许这与Artemis何时真正能部署在该公司的数据中心有关。

公开消息显示,Meta正在加速建设数据中心(IDC),以专注于GPU计算。Meta更新其IDC的最新努力主要集中在构建拥有数千个加速器的大型集群;IDC的核心网络以网格形式组织,加速器之间的带宽为每秒1 TB。Meta在全球拥有21个数据中心。

但很显然,这还不够。要实现扎克伯格的最终目标,还需要更多的GPU。

“很明显,下一代服务需要构建全面的通用智能、构建最好的AI助手、为企业创造者以及更多要在AI各个领域取得进步——从推理到规划到编码到记忆和其他认知能力。”扎克伯格说,“人们还需要新的人工智能设备,这将AI和元宇宙结合在一起,因为随着时间的推移,我认为我们很多人会在一天中频繁地与AI交谈。”

VR/AR部门单击营收创纪录

Meta引人注目的最新表现,是在2月1日。

这一天,Meta公布了截至2023年12月31日的2023财年第四财季业绩。

财报显示,Meta在2023年第四季度实现营收401.1亿美元,较去年同期增长25%,高于分析师预期的390.1亿美元,这也是Meta自2021年三季度以来最大的营收增幅;净利润同比增长201%至140.17亿美元,高于市场预期的128.90亿美元;摊薄后每股收益同比增长203%至5.33美元,高于市场预期的4.95美元。

2023年全年,Meta实现营收1349.02亿美元,同比增长16%;净利润同比增长69%至390.98亿美元。

不仅如此,Meta预计在今年一季度,公司营收将达到345亿美元至370亿美元之间,高于分析师预期的336.4亿美元。

比这更夺人眼球的是Meta宣布增加500亿美元股票回购,将在今年三月进行公司史上首次发放股息红利,包括A类普通股和B类普通股,每股派发0.50美元现金。

受多项利好消息刺激,2月1日盘中,Meta市值增加了约2000亿美元,为美股历史上首次。

至收盘,Meta录得20.32%的巨大涨幅,超越苹果亚马逊此前创出的最佳单日表现纪录。苹果市值曾在2022年11月10日增加1909亿美元,亚马逊于同年2月4日增加1908亿美元市值,英伟达市值在2023年5月25日增加了1841亿美元。

值得一提的是Meta的VR/AR部门Reality Labs,负责Quest头显、Ray-Ban智能眼镜、Horizon平台以及AR眼镜及其神经腕带输入设备的研发。

据Meta最新财报显示,Reality Labs的季度收入为10.7亿美元,也创出了一项新纪录。Meta首席财务官Susan Li称,这一创纪录的收入“由Quest 3在假期期间的销售推动”。Quest 3于2023年10月10日推出,Meta第四季度营收包含10月、11月和12月。

苹果在今年1月19日开始预订Vision Pro,至2月1日,据称已售出超过20万台(3499美元/台,据2月2日美国苹果门店的用户称,当日有人接受每台2000美元的加价),这给苹果带来了约7亿美元的收入。

Meta财报显示,由于2023年第四季度Reality Labs的成本达到有史以来最高的57.2亿美元,故而导致该部门季度亏损了46.5亿美元。

但市场对此显得很宽容,认为像Quest这样的XR头显仍然是一项相对早期的技术,远未成熟,因此将这项亏损认为是早期投资的必须。目前,Meta还没推出AR眼镜,但Reality Labs超过50%的支出都集中在AR眼镜的研发上。

据Valve公布的2024年1月Steam平台的VR设备使用数据显示,1月VR头显使用量增加0.4%。其中,占比排名第一的是Quest 2,1月使用份额为40.64%;Valve Index HMD排名第二,使用份额为15%;Quest 3排第三,占整体使用份额的14.05%。

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

责任编辑:马梦斐



用户登录