xAI发布Grok 4:10万H100打造,马斯克宣称“智力超越博士”
凤凰网科技讯 7月10日,马斯克旗下人工智能公司xAI正式发布其最新一代大语言模型Grok 4,并同步推出多智能体协作版本Grok 4 Heavy。Grok 4定位为“全球最强大的人工智能模型”。马斯克宣称,Grok 4的智能水平已经“全面超越博士智力”,尤其在学术问题上,它能在所有学科中达到甚至超越博士级别。马斯克更乐观预计,Grok 4有望在今年内为人类带来“发现新技术”的突破,并可能在明年发现新的物理现象。
xAI介绍,Grok 4在训练计算量上实现了显著飞跃,与Grok 2相比,其训练量增加了100倍。特别是在推理和强化学习(RL)方面,Grok 4投入了大量计算资源,其RL计算量是其他任何模型的10倍以上。这得益于xAI构建的拥有10万块H100 GPU的“世界超级计算机”。Grok 2在12个月前还只是一个概念,而如今的标准下,Grok 2的模型智能水平已相当于高中生。
在多项严苛的基准测试中,Grok 4展现出强大实力。在被称为“人类最终考试”的HLI(Humanities Last Exam)基准中,该模型在未使用工具的情况下解决了25%的问题。而其多智能体版本Grok 4 Heavy,通过并行协作,进一步将文本子集问题的解决率提升至超过50%。此外,Grok 4还在包括PhD级别问题集在内的所有推理基准测试中表现出色,甚至在编码基准和数学竞赛中取得了满分,通常比第二名模型有显著领先。
Grok 4的强大能力已在多个实际场景中得到验证。在模拟商业环境的“自动售货机基准测试”中,Grok 4表现最佳,其创造的净资产是第二名模型的两倍,并能长期坚持其策略。它还能协助生物医学研究,帮助科学家筛选数百万实验日志,快速提出最佳假设,并已应用于CRISPR研究。在游戏开发领域,Grok 4展示了4小时内生成第一人称射击游戏的能力,通过自动化资产采购,大幅提升了开发效率。它甚至能基于X平台数据分析并预测世界杯赔率、查找特定内容或生成复杂的时间线,并能生成大致正确的双黑洞碰撞可视化。
目前,Grok 4及其多智能体版本Grok 4 Heavy已通过订阅服务开放使用。开发者也可通过API接口访问,其上下文长度高达256K。xAI同时公布了Grok语音模式的显著提升,端到端延迟降低一半,并引入了多款更自然、富有情感的新声音,例如具有史诗般低沉声线的Sal和能表达丰富情感的英伦女声Eve。
尽管Grok 4在多模态理解(特别是图像理解和生成)方面仍存在“部分盲点”,但xAI表示,其基础模型的第七个版本(计划在几周内完成训练)将解决这一弱点,未来模型将能够像人类一样“听到和看到世界”。xAI正加速推进视频生成模型的训练,预计今年将出现首部可观看的AI生成电视节目片段,明年有望出现首部AI电影。
公司强调,未来将专注于开发既“快速又智能”的模型,尤其是在编程领域。xAI认为,人类正处于一个“巨大的智能爆发的开端”,并预期AI将驱动经济规模达到当前数千甚至数百万倍。同时,xAI也强调AI安全的重要性,认为AI最重要的是要“最大限度地追求真相”,如同培养一个有正确价值观的“超级天才儿童”。
未来,xAI设想Grok与特斯拉Optimus类人形机器人结合,通过与现实世界的互动,将能更深层次地验证假设,推动AI能力的最终飞跃。
(来源:新浪科技)