xAI发布Grok 4：10万H100打造，马斯克宣称“智力超越博士”

2025年07月10日,14时12分05秒科技新知阅读 4 views 次

凤凰网科技讯 7月10日，马斯克旗下人工智能公司xAI正式发布其最新一代大语言模型Grok 4，并同步推出多智能体协作版本Grok 4 Heavy。Grok 4定位为“全球最强大的人工智能模型”。马斯克宣称，Grok 4的智能水平已经“全面超越博士智力”，尤其在学术问题上，它能在所有学科中达到甚至超越博士级别。马斯克更乐观预计，Grok 4有望在今年内为人类带来“发现新技术”的突破，并可能在明年发现新的物理现象。

xAI介绍，Grok 4在训练计算量上实现了显著飞跃，与Grok 2相比，其训练量增加了100倍。特别是在推理和强化学习（RL）方面，Grok 4投入了大量计算资源，其RL计算量是其他任何模型的10倍以上。这得益于xAI构建的拥有10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念，而如今的标准下，Grok 2的模型智能水平已相当于高中生。

在多项严苛的基准测试中，Grok 4展现出强大实力。在被称为“人类最终考试”的HLI（Humanities Last Exam）基准中，该模型在未使用工具的情况下解决了25%的问题。而其多智能体版本Grok 4 Heavy，通过并行协作，进一步将文本子集问题的解决率提升至超过50%。此外，Grok 4还在包括PhD级别问题集在内的所有推理基准测试中表现出色，甚至在编码基准和数学竞赛中取得了满分，通常比第二名模型有显著领先。

Grok 4的强大能力已在多个实际场景中得到验证。在模拟商业环境的“自动售货机基准测试”中，Grok 4表现最佳，其创造的净资产是第二名模型的两倍，并能长期坚持其策略。它还能协助生物医学研究，帮助科学家筛选数百万实验日志，快速提出最佳假设，并已应用于CRISPR研究。在游戏开发领域，Grok 4展示了4小时内生成第一人称射击游戏的能力，通过自动化资产采购，大幅提升了开发效率。它甚至能基于X平台数据分析并预测世界杯赔率、查找特定内容或生成复杂的时间线，并能生成大致正确的双黑洞碰撞可视化。

目前，Grok 4及其多智能体版本Grok 4 Heavy已通过订阅服务开放使用。开发者也可通过API接口访问，其上下文长度高达256K。xAI同时公布了Grok语音模式的显著提升，端到端延迟降低一半，并引入了多款更自然、富有情感的新声音，例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。

尽管Grok 4在多模态理解（特别是图像理解和生成）方面仍存在“部分盲点”，但xAI表示，其基础模型的第七个版本（计划在几周内完成训练）将解决这一弱点，未来模型将能够像人类一样“听到和看到世界”。xAI正加速推进视频生成模型的训练，预计今年将出现首部可观看的AI生成电视节目片段，明年有望出现首部AI电影。

公司强调，未来将专注于开发既“快速又智能”的模型，尤其是在编程领域。xAI认为，人类正处于一个“巨大的智能爆发的开端”，并预期AI将驱动经济规模达到当前数千甚至数百万倍。同时，xAI也强调AI安全的重要性，认为AI最重要的是要“最大限度地追求真相”，如同培养一个有正确价值观的“超级天才儿童”。

未来，xAI设想Grok与特斯拉Optimus类人形机器人结合，通过与现实世界的互动，将能更深层次地验证假设，推动AI能力的最终飞跃。

(来源：新浪科技)

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

关联资讯:

用户登录