马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?

2025年07月10日,16时07分32秒 机构观点 阅读 3 views 次

7月10日中午12点,经历了前一代模型的延期和此次直播推迟,埃隆·马斯克终于现身Grok 4发布会进行开场,画面中的他略显憔悴,一周前提及“和xAI团队通宵打磨模型”,看起来为这次发布准备已久。

在帖子中,官方称此次发布的Grok 4是 “全球最强大的AI模型”,马斯克则在直播中表示,“Grok 4几乎在所有学科上都比人类研究生更聪明” ,具体含金量如何?

数据显示,Grok 4的多项基准测试很能“打”,实现了对现有顶尖模型的超越。在AIME25数学竞赛上,Grok 4拿下了满分,在“人类最后的考试”(HLE)测试中,不用工具的情况下拿下了26.9%的高分,该测试包含 2500 个专家级问题,涵盖上百个学科。

测评机构Artificial Analysis获得早期访问权限并在发布会后公布了 Grok 4 基准测试,官方提到,Grok 4的人工智能分析指数达到73,“是我们的智能指数首次将 xAI 列为第一名”。从数据来看,Grok 4领先于 OpenAI o3(70)、谷歌Gemini 2.5 Pro(70)、Anthropic的 Claude 4 Opus(64)和国内DeepSeek R1 0528(68)。

马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?

根据Artificial Analysis 的测试,在“人类最后的考试”中Grok 4则取得了24%的历史最高分,超过了谷歌Gemini 2.5 Pro 之前21%的历史最高分。不过,测试分数只是一方面,Grok 4模型的能力还需要看后续开发者们实际使用的效果,目前模型刚推出不久,实测案例并不多。

xAI团队在直播中透露,Grok 4的训练量是Grok 2的100倍,在强化学习(RL)阶段投入的算力,是市面上其他任何模型的10倍以上。发布会介绍,Grok 4 的订阅费为 30 美元/月,更强大的Grok 4 Heavy 版本的费用为300 美元/月,Grok 3 维持免费开放。

值得一提的是,此次直播比原定的时间推迟了约一小时。xAI准点发布帖子称“Grok 4 直播即将开始”,但1小时过去直播仍未推出,评论中网友们一边催更,一边质疑是否“又是炒作”。

在这之前,马斯克在X上频频为Grok模型预热,但Grok 3.5模型最终跳票,一度引发对模型能力的怀疑。4 月底,马斯克就在 X上预告,Grok 3.5Beta版下周将上线,主打专业问答能力,特别是工程、编程类问题。但直到5月中旬,马斯克才出来回应称,“还有点粗糙,再打磨一周。”

马斯克在6月27日再次提到Grok,表示在和xAI团队通宵打磨模型,进展不错,即将发布的模型被命名为Grok 4。也就是说马斯克和团队选择跳过Grok 3.5,“端”出更高的迭代版本,针对模型跳票后外界的质疑,看起来是一个很好的挽救方案。

从这次迟到看,发布显得有些仓促,不过从性能测试看没有让行业失望。xAI整个团队为这次Grok 4的发布熬了不少夜,此前有博主访问了xAI的办公室,画面显示办公区走廊两侧全是帐篷,这意味着不少核心员工近段时间可能都睡在办公室。

马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?

马斯克在2023年7月才成立xAI,两年时间就追上了行业最顶尖的水平,充足的资金和算力是他的筹码。

为了支持Grok的开发和训练,马斯克在美国田纳西州孟菲斯建立了超级计算中心“Colossus”,在2024年7月启动时配备了10万块英伟达H100 GPU,到 2025 年 2 月,GPU 数量已翻倍至 20 万块。马斯克计划将孟菲斯超级集群的规模扩展到 100 万块 GPU,并且正在为此筹集资金。

就在上周6月30日,华尔街大行摩根士丹利在X上发布声明称,xAI已完成总计100亿美元的新一轮融资,其中包括50亿美元债务融资和50亿美元股权融资。这是xAI继去年两轮各60亿美元的融资后、又一轮大额融资,2024年以来xAI公开的总融资额已达220亿美元(约为人民币1579亿元)。

目前尚不清楚本轮融资后xAI的具体估值,此前3月xAI与X合并后估值高达1130亿美元。其中xAI估值为800亿美元,X的估值为330亿美元。

但如此庞大的融资,也很难支撑大模型公司的巨额花销。据媒体援引消息人士报道,xAI目前每月消耗高达10亿美元,截至2025年3月底,公司账面现金仅剩40亿美元。此次融资后,xAI或许能支撑一段时间,但明年还需继续筹资,目前其收入远远小于其成本。

马斯克曾公开表示,像xAI这类巨额亏损在整个AI行业并不罕见,主要源自高昂的服务器建设和芯片采购成本。

xAI在商业化进展方面的表现还落后于一些竞争对手,xAI的主要营收来源是X Premium的订阅服务,预计2025年营收仅为5亿美元,明年预计可达到20亿美元。对比来看,OpenAI预计2025年营收将达127亿美元,且业务更加多元化。

虽然此次Grok 4短暂领先了,但今年夏天OpenAI也将发布其最新旗舰模型GPT-5,这一领先优势能保持多久并不确定。海外大厂对于AI模型也是势在必得,微软亚马逊、谷歌和Meta四大巨头去年的总资本支出为2300亿美元,2025年这些公司的投资计划则高达3200亿美元,在财报中管理层纷纷表示,计划增加对AI技术和数据中心建设的投资。

xAI对未来较为乐观。在与X合并后,xAI团队希望,能够利用X上庞大且不断更新的数据档案来训练其模型,从而避免像其他公司那样支付昂贵的数据费用。xAI乐观地预计将在2027年实现盈利,相比之下,OpenAI据悉预计要到2029年才能实现现金流转正。

编程和更强大的多模态智能体是xAI接下来的看点。在此次直播中,团队定下目标,在8月发布编程模型,9月发布多智能体,10月发布视频生成模型。不过,结合此前多次的延期,这个时间点是否靠谱还需要打个问号。

马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?

马斯克带领xAI团队发布Grok 4 “全球最强模型”含金量如何?

(来源:天天基金网)



用户登录