开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜 | 量子位

2025年09月17日,07时00分53秒 OpenAI 阅读 4 views 次

开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜 | 量子位 2025-09-11 18:04:23 来源:量子位

21B总参数、激活仅3B的轻量级模型

据HuggingFace官网数据,截至2025年9月11日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趋势榜上排名第一,模型总榜排名第三。

开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜 | 量子位

据介绍,ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。

该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

公开资料显示,ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

就在不久前,WAVE SUMMIT深度学习开发者大会2025上,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。

(来源:量子位)

版权所有,未经授权不得以任何形式转载及使用,违者必究。
标签:


用户登录