阿里Qwen3能否成为下一个DeepSeek?

2025年05月07日,21时48分59秒 科技新知 阅读 22 views 次

4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。

作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek?

发布后不久,华为计算官方发文称,昇腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。

“发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。”共绩算力COO王鹏告诉《IT时报》记者,目前Qwen3部署成本较低,Qwen3-235B-A22B只需要4张H20,而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者,Qwen3发布第二天已接到客户订单。

成本较DeepSeek大幅下降,仍未解决幻觉问题

与此前的模型相比,Qwen3有着明显提升。

在架构上,Qwen3采用混合专家(MoE)架构,以旗舰模型Qwen3-235B-A22B为例,总参数量高达235B,但激活仅需22B,大大降低了运行时对算力的即时需求。

这一设计使得模型在面对不同复杂程度的任务时,能够灵活调配计算资源,针对简单问题快速响应,复杂问题深度思考,实现“快思考”与“慢思考”的结合,兼顾效率与准确性,为模型应用开拓了更广阔的空间,有望改变行业对模型应用场景适配的传统思路。

阿里Qwen3能否成为下一个DeepSeek?

预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。

与DeepSeek-R1相比,Qwen3参数量仅为其1/3,成本大幅下降。在部署方面,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。“这对于中小企业和个人开发者而言,极大降低了使用高性能模型的成本门槛和部署时间。”王鹏表示。

但也有不少AI发烧友实测后在社交平台上指出,Qwen3在长文本能力上的表现并不算突出,有一定幻觉率,但在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。《IT时报》记者使用Qwen3网页版尝试生成关于“去年五一小长假旅游数据与景区特性关联”的报告,Qwen3“普通”模式未能给出准确数据支持,出现了较高的幻觉率,但在“深度思考”模式下,幻觉率大幅降低,数据更加准确。

祭出AI“双子星”战略,阿里迫切想在C端站稳脚跟

在当下AI赛道,科技巨头们的每一步落子都备受瞩目。

近期,一则有关算力抢购的传闻甚嚣尘上,传言腾讯、阿里、字节跳动纷纷下场,重金争抢GPU算力资源。虽然字节跳动已出面辟谣,称相关信息不实,但这一传闻本身,足以反映科技大厂对AI战略布局的重视与急切。

作为AI发展的根基,算力的重要性不言而喻。阿里此前更是公开表态,未来三年将投入超3800亿元用于云和AI硬件基础设施建设。

当前,阿里集团各个业务板块将AI作为重要KPI,从阿里的整体AI战略布局来看,对AI的投入持续加大,试图强化通义千问与夸克的“双子星”格局。通义千问专注于支撑云上智能,夸克则着力打造端侧入口,协同推动阿里AI To C战略的落地。

与此前最大的不同是,“夸克”和“通义”成为Qwen3的主要体验入口,这两大App所有用户均可免费使用这一最新的开源模型。

“通义App在C端并没有打出声量,只能委以夸克重任。”一位阿里内部人士曾对《IT时报》记者表示。

通义千问凭借在多模态处理和复杂任务推理方面的技术优势,曾为阿里的B端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型,实现了用户方言语音规划行程的功能;Rokid AR眼镜搭载其技术后,能够进行实时翻译。通义千问在大模型开源上跑得很快,但是,其“通义”App在C端应用上并没有使出“撒手锏”。

反倒是夸克突破重围,第三方数据显示,2025年3月,夸克的MAU(月活跃人数)达到1.48亿,登上国内AI应用榜首。

2024年底至2025年初,阿里通过一系列组织架构调整和人才布局推进AI To C战略,将AI应用“通义”并入智能信息事业群,整合天猫精灵与夸克团队,并聘请顶尖AI科学家许主洪负责AI To C业务研发。

阿里AI战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时,如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。其API(应用程序编程接口)价格虽具备一定竞争力,但部分中小企业在技术对接与模型二次开发方面,仍面临诸多困难。夸克同样面临挑战,随着用户数量的快速增长,体验稀释问题逐渐凸显,部分功能在流量增加时响应速度变慢,这就要求夸克必须优化技术架构与服务器性能,以确保用户体验的稳定性。

AI市场竞争激烈,腾讯的混元大模型依托微信庞大的用户基础和生态优势,在微信多个入口为元宝争取亮相的机会,对C端用户形成“茧房式包裹”。字节跳动旗下的豆包借助旗下抖音的推流优势,在2024年11月MAU飙升至5998万,几乎长期霸榜AI应用下载量榜单前三。

虽然手握通义和夸克“双子星”,一条腿迈进开源圈,一条腿迈向C端用户,但在巨头环伺下,阿里AI战略的前路仍充满变数。

(来源:新浪科技)



用户登录