2025AI中场战事:谁在撤退,谁在进攻?
文 | 新摘商业评论 ,作者 | 南一
目前,国内AI大模型市场由“百模大战”逐渐进入淘汰整合的中场阶段。
历经2023年以来的“百模大战”和资本狂热,行业格局正逐步清晰。曾经百家争鸣的局面已经洗牌,今天的舞台由新老巨头与新晋独角兽两大阵营主导。
在头部技术路线和商业化落地上,老牌互联网巨头和“新BAT”——以百度、字节跳动、阿里、腾讯、为代表,抢占先机;同时涌现出的“基模五强”——字节跳动、阿里、阶跃星辰、智谱AI、DeepSeek等也在全线发起进攻。
这些巨头与独角兽们在模型创新、算力投入、生态布局、开源策略等方面各有打法。与此同时,“AI六小龙”的处境却出现分化,有的已开始收缩阵脚。
距离ChatGPT发布仅过了2年,从巅峰时期的300家大模型同台竞技到洗牌至以月之暗面、MiniMax、智谱、阶跃星辰、零一万物、百川智能为代表的“大模型六小龙”。他们曾雄心勃勃追赶OpenAI的脚步。
然而当前,随着巨头势力全面加持,技术门槛和成本壁垒不断攀升,“小龙们”的生存空间正在被挤压。同样重要的是,新一轮AI攻势还催生了一批规模巨大的玩家。
字节跳动、阿里为代表的巨型互联网公司纷纷在大模型领域加大投入,各自布局了大型AI中台和应用生态。和他们并肩作战的,还有新崛起的阶跃星辰、智谱AI、DeepSeek等明星级创业团队。这些“新基模五强”为主的玩家各显神通,掀起了又一轮技术与市场竞争。如今战线已从前沿算法逐步向商业化与生态落地转移,价格战与应用场景争夺成为新的焦点。
一、高筑墙,广积粮,新老BAT凶猛
在这场AI博弈中,巨头阵营的攻势格外凶猛。
字节跳动在这一轮洗牌中保持了稳扎稳打的进攻态势,近年推出的“大模型家族”,如豆包系列模型,在多模态理解与生成上持续升级。最新的豆包通用模型(Doubao-Pro)在公开评测中已与GPT-4系列看齐。字节还针对不同应用场景不断优化模型结构,今年公布的视觉理解模型和种子级文本、语音、音乐等专用模型,使其在语言、视觉、声音等多模态任务上都保持行业领先。
更重要的是,字节对AI商业化投入巨大,豆包系列在公司内部50多个业务场景中大规模上线,日调用量已突破4万亿tokens,7个月增长33倍之多。
不仅如此,为了抢占市场,字节还大胆降价,力推“厘时代”。2024年5月,豆包通用模型首度对外发布时定价仅0.0008元/千token,比行业均价低99.3%;年底再推视觉理解模型,价格仅0.003元/千token,比行业价低85%。这一轮降价风暴在火山引擎AI大会上一举打响,字节相关负责人透露:“5月豆包日调用量1200亿,此前已飙升到4万亿”。
同时,跌价带来的正向循环迅速显现,底层算法实力加上亿级用户生态(抖音、头条、飞书等),使豆包迅速形成覆盖千行百业的闭环。
字节还通过开放开发平台“扣子”集聚开发者,目前已有百万活跃开发者参与构建了200万智能体,全面铺开AI应用生态。综合技术实力、资金、生态三者,字节已成为AI赛道的领跑者之一,其打法可总结为“更强模型+更低价格+更易落地”。
阿里作为开源最早、最完整的大公司,在AI的投入上也最坚决。
截至目前,通义团队累积开源200多款模型,涵盖了千问(Qwen)大语言模型和万相(Wan)视觉生成模型两大基座系列。在4月底,阿里发布的最新“千问家族”Qwen3 系列模型,包含 0.6B 至 235B 规模的多款模型(包括两款 Mixture-of-Experts 大模型),并选择将模型完全开源。在性能方面,Qwen3 小模型(4B 参数)可以达到上一代 Qwen2 大模型的效果,而 Qwen-3 系列整体在多模态和推理上有显著提升。整体布局,正如马云所言,“AI 不是选择题,而是阿里的必答题”。
配合新模型,阿里还在云服务端积极降价抢市场,2024 年,阿里已将多款大模型推理价格砍至原价的3% 左右,并在 2025 年继续降价。阿里通过开放模式与巨额补贴双管齐下,一方面开放底层模型以吸引全球开发者关注,另一方面下调成本激发生态活力,反映了持续投入的决心。
腾讯在大模型领域的战略和部署同样持续进化。
4月份,腾讯对其混元大模型研发体系进行了全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。调整后,腾讯成立两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型,提升模型能力。腾讯官方人士表示,此举旨在优化研发流程、整合资源,以应对大模型时代日新月异的挑战。
此前,腾讯已经将元宝、ima、QQ浏览器、搜狗输入法等几大AI产品线整合,提出“核心自研+拥抱开源”的AI策略。具体来看,腾讯自研的混元模型多模态性能强劲。今年推出的“快思考”Turbo S模型和“深度思考”T1模型,在公开基准上均达业界领先水平;在视觉、3D生成领域,腾讯也开源了多款模型(如混元3D生成、混元视频生成、文生图DiT、千亿参数混元MoE模型等),这些模型在GitHub上收获了近3万星标。混元模型已深度嵌入微信、QQ、腾讯会议、腾讯文档等产品,提高了用户端的智能化体验,同时通过腾讯云向外输出能力,助力合作伙伴创新提效。
值得注意的是,据腾讯2024年四季度及年度财报显示,腾讯研发投入再次创下历史新高,达到707亿元,这为其大模型技术攻关提供了雄厚后盾。在持续的中场博弈中,腾讯凭借底层算法实力、开源影响力和全域生态的输出,构筑了独特的防线和进攻点。
同样,作为老牌互联网巨头,百度在2025年上半年持续加码大模型研发与开源,以“文心大模型”4.5系列为核心,先后推出并免费开放 ERNIE 4.5 和深度思考 X1,其性能在多模态理解和推理能力上已全面超越同级竞品,且通过 Turbo 版本将推理成本分别降低至 0.8 元和 1 元/百万 Token。
市场应用层面,文心一言平台自4月全面免费后,用户规模迅速攀升至 4.3 亿,日均调用量突破 15 亿次。未来 ERNIE 5.0 的推出,预计在多模态融合与推理效率上进一步革新。
在产品与生态层面,百度已将大模型能力深植搜索与智能助手,先后上线“AI搜”智能检索服务和通用智能体 App“心响”,覆盖知识问答、文档处理、旅游规划等百余场景,并通过开放 API 吸引开发者创新。
二、新锐突围,基础大模型格局再洗牌
除了“新老BAT”外,一些大模型初创企业同样展开全面进攻。
上海独角兽阶跃星辰作为新兴力量,今年来动作频频。2024年末该公司完成B轮融资数亿美元,由上海国资领投、腾讯等战略投资者跟投。官方披露,融资将继续用于核心大模型的研发,特别是强化多模态和复杂推理能力,并通过产品生态进一步渗透C端市场。
今年2月,阶跃星辰开源发布了其性能最强的两款多模态模型:其中“Step-Video-T2V”拥有300亿参数,能生成204帧、540P高质量视频;“Step-Audio”在多项公开语音评测中超越业内同类开源模型,尤其在汉语六级水平考试中表现突出。
据了解,成立不到两年、团队500余人的阶跃星辰,在迭代了11个模型后跻身“AI六小虎”行列,并被《麻省理工科技评论》评为“中国值得关注的四家AI创业公司之一”。公司高管透露,团队中算法和技术人员占比接近八成,创始人姜大昕为微软前高管、IEEE Fellow入选者,首席科学家张祥雨则为ResNet论文合著者。这些“高密度人才”正支撑阶跃星辰在多模态技术上的狂飙突进。
与此同时,来自清华学府的智谱AI也高速扩张,并已启动上市进程。今年4月,智谱AI正式在证监局备案辅导(中金公司为辅导机构),标志着其成为国内首家进入IPO流程的大模型创业公司。
智谱AI自2019年成立以来,一直专注认知智能大模型研发。该公司与学术机构合作打造了中英双语千亿参数预训练模型GLM-130B,并基于此推出了对话模型ChatGLM及其开源版本ChatGLM-6B。
除通用模型外,智谱还推出了多模态和行业应用组件:包括AI助手“智谱清言”、高效代码生成模型CodeGeeX、视觉语言理解模型CogVLM、文生图模型CogView等。商业模式上,智谱主张“模型即服务(MaaS)”,已建成AI开发开放平台,为政府和企业提供私有化部署和智能体解决方案。
据官方介绍,其MaaS平台已支持百万量级开发者,与全球多家车厂、终端厂商合作,将大模型从“聊”引向“行”。凭借深厚学术背景与产业合作,智谱AI正力图成为“基座模型”领域的领军企业。
在这阵营中,DeepSeek的声音当然也不容忽视。DeepSeek团队非常低调,但技术打法极具冲击力。他们专注于语言模型、尤其是数理逻辑能力,并秉持坚定的开源策略。今年农历春节期间发布的DeepSeek-R1模型,以远低于常规的算力投入,实现了与GPT-4等顶级模型媲美的性能。
业内分析认为,DeepSeek在训练方法上的创新才是关键:其采用的Mixture-of-Experts架构使模型参数总量达6710亿,但运行时只激活37亿参数,大幅降低计算需求;多Token预测和“潜注意力”等技术也极大提升了效率。
简言之,DeepSeek走的是偏科研的路线,不急于变现,团队以顶尖新秀为主、规模精简,将更多资源投入算法优化。正因如此,一度被忽视的DeepSeek一经开源便引爆关注,据报道,其App已突破3000万日活,成史上最快登顶的AI应用之一。投资者与同行也纷纷围拢,例如新浪财经报道,“DeepSeek-R1开源后,众多业内人士重新审视DeepSeek的技术实力,私募纷纷尝试接触其创始人梁文锋”。DeepSeek通过极致的工程优化与开源创新,已悄然建立起自己的竞争优势。
总体来看,以字节跳动、阿里巴巴、腾讯为代表的新BAT,以及阶跃星辰、智谱AI、DeepSeek等新兴主力,构成了当前中国AI“大模型”赛道的进攻重兵。他们在技术研发、人才储备、资金投入和市场开拓上全面发力,推动着AI技术不断向世界前沿靠近。在这种格局下,大公司的优势在于资源与生态整合,而创业公司则更强调创新与专注,各有千秋。
三、退守与聚焦,AI六小龙瓦解
相比之下,“AI六小龙”——曾被寄予厚望的创业小企业,则出现了明显分化。
以李开复创办的零一万物为例,2025年伊始便曝出要将预训练团队出售给阿里的传闻。尽管李开复辟谣称并非出售,但他已承认“目前只有大厂能持续投入超大规模模型训练”。公司大幅调整方向,主动与阿里云合作成立“产业大模型联合实验室”,将预训练算法团队和基础设施团队交给阿里,专心做小参数高性价比模型。他坦言:“我们不再做超大模型,不是因为不相信 Scaling Law,而是把这件事交给能做的大公司来做,我们跟他们合作,这才是生存之道”。
零一万物开始放弃自行训练万亿参数模型,转向针对电商直播、会议等场景的行业智能应用,推出 AI 数字人和“Yi”系列服务。虽未立刻倒闭,但其已清晰地从“造基座”往后撤步,调整为聚焦落地应用。
同样,百川智能也显示出战略调整迹象。2024 年 7 月宣布完成 50 亿元人民币 A 轮融资,估值约 200 亿元,投资方包括阿里、腾讯、小米等互联网巨头。百川主打医疗方向,大模型“百川-53B”于 2023 年底问世,AI 助手“百小应”上线,曾在 2024 年 WAIC 展台展示医疗问诊应用。
而今年3 月中旬就有媒体爆出,百川两位联合创始人已经确认离职。股权回购与融资并购也传出争议。此外,王小川在内部信中提到了成立两年来百川智能的不足,称公司“两年来战线拉得太长、不够聚焦”,公司前后已经裁撤部分 ToB 金融部门,将重心回归医疗专家模型和百小应产品。可见百川虽依然获得资金支撑,维持产品更新和生态拓展,但内部正在精简业务以求聚焦。
月之暗面近期明显收紧打法,缩减烧钱战略。春节后有媒体披露,在DeepSeek攻势之下,月之暗面决定大幅压缩市场推广预算,暂停多款安卓渠道投放并解除第三方广告合作。公司内部将此归因于“外部环境变化和战略调整”,表明其营销打法将更加谨慎。
此前,月之暗面曾以广撒网的方式重点推广AI助手Kimi,也在海外推出Ohai、Noisee等产品。但根据晚点财经报道,月之暗面今年9月已决定停止Ohai和Noisee的运营,将资源集中在核心产品Kimi。有两位负责海外产品的高管离职创业,创办了定位于AI编程的公司。这些动向与资本市场的谨慎形成对照,不难看出,这家曾估值近25亿美元的独角兽在战术上更加聚焦,降低了非核心业务拓展的投入。
而MiniMax的路径选择就显得既谨慎又富有张力。这家曾因创始团队出身商汤而备受瞩目的公司,早期凭借Talkie这类情感陪伴类应用快速打开海外市场,日交互量一度突破30亿次,但如今却面临用户增长乏力、留存率下滑的困境。当赛道瓶颈逐渐显现,MiniMax继而调整策略,逐渐淡出同质化严重的情感陪聊红海,转而将资源向视频生成、音乐创作等更具技术壁垒的领域倾斜。
MiniMax作为国内首个自主研发MoE混合专家架构的团队,他们早已不满足于单一模态的较量,而是构建起覆盖文本、语音、图像、视频的全矩阵模型体系。
产品布局上,MiniMax采取To B与To C双线并进的策略。To B端通过开放平台接入3万家企业,覆盖客服、教育等标准化场景以降低边际成本;To C端则依靠星野、Talkie等情感陪伴应用积累日均30亿次交互数据,但面临用户增长放缓、付费能力有限及海外监管风险。近期推出的海螺AI试图以文生视频、音乐生成等特色功能突破同质化竞争,但渗透率仍需提升。
今年3月,MiniMax虽获6亿美元A + 轮融资,旗下Talkie应用日交互量超30亿次,却仍未找到稳定盈利模式。尽管有大量资金注入且产品有一定用户活跃度,但MiniMax在盈利模式上尚未取得突破,目前仍在不断尝试和调整,以在竞争激烈的市场中找到可持续发展的道路。
总的来看,AI创业“小龙们”的走势已有显著差异,但是,这种趋势并非败退,而是行业成熟期必然的理性回调,最终目标是在巨头夹缝中守住“小而美”的生存空间。
相反,以字节、阿里、腾讯为首的重量级玩家由于资金、人才、生态和数据积累优势,正处于中场竞赛的主动位置。未来谁能在“智能上限”和“多模态能力”上取得突破,还有待考验。
但可以肯定的是,这场“中场战事”已经由此前的狂飙突进转向稳扎稳打的比拼,各路玩家都在砥砺技术、优化策略,一方面力图保留优势,一方面寻求新的成长路径。要知道,“大模型的路要跑得清楚,最终还得落到产品上”,谁能走得更久、更稳,将决定这场AI竞赛的下一阶段格局。
(来源:钛媒体)