阿里3800亿押注算力,智谱AI大打价格战,AI五强争霸背后的生态博弈与估值困局
文 | GPLP,作者 | Colin
经历了2023年的“百模大战”后,国内的大模型市场逐渐从资本狂飙和野蛮生长中转向,市场也格局也逐渐从粗放式扩张,转向头部收敛,并由字节跳动、阿里巴巴、阶跃星辰、智谱AI、DeepSeek,这五家企业构建起了"基模五强"的市场格局。
在这样的背景下,资本市场对AI的估值逻辑,也从“技术幻想”转向“盈利验证”,这意味着,单纯做好技术难以在企业发展的道路上像过往一样起到决定性作用,当下,更是企业的商业生态和产业话语权的全方位博弈。
从“百模混战”到“五强争霸”AI格局重塑
2024年堪称中国大模型产业的分水岭,尤其是在技术和资本门槛双双提升的背景下,市场已从初期的野蛮生长进入深度洗牌阶段。曾经涌现的百余家参赛者中,仅字节跳动、阿里巴巴、阶跃星辰、智谱AI与DeepSeek五家企业脱颖而出。
其中,DeepSeek的横空出世极具象征意义,其最新模型以GPT-4的1%成本实现90%性能,将推理效率提升62倍。这种突破并非偶然,背后是长达18个月的工程优化积累,涉及MoE架构创新、多token预测算法等23项核心技术专利。数据显示,其模型推理能耗较行业平均降低89%,彻底打破"算力军备竞赛"的固有认知。
除“技术尖子生”DeepSeek之外,头部阵营的其他玩家也在大模型的投入规模上对中小企业形成碾压优势。比如,字节跳动在2024年就AI相关资本开支达800亿元,相当于百度、阿里、腾讯三家之和的80%,阿里宣布未来三年投入3800亿元建设AI基础设施,超过其过去十年总和。这种千亿级量级的投入正在改变游戏规则——中小玩家已无力参与基础模型竞争。
与此同时,生态闭环也在加速构建。其中,头部企业正通过垂直整合形成生态壁垒。字节跳动构建起从豆包大模型到扣子开发平台、火山引擎云服务的完整链条,仅以豆包大模型为例,其调用量已开启了爆发式增长,从2024年5月推出时日均调用tokens量约1200亿,一路上涨至2024年12月15日突破4万亿,七个月增长超33倍。与百度相比,豆包对外调用的每日tokens调用量优势明显。
阿里则依托通义开源生态,形成"开源获客-云服务变现"的商业闭环。
这种头部玩家集中化趋势与全球市场形成共振——美国市场同样呈现OpenAI、Google、Anthropic、Meta、X.ai五强割据,印证了大模型产业"强者恒强"的发展规律。
战略分化,五大路径的“殊途之争”
对AGI时代的不同预判与布局决定了"基模五强"在战略选择上的不同。
其中,字节正复刻移动互联网时代的成功路径,凭借日均5000亿token处理能力,目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖4亿终端设备等,形成“基础模型免费+增值服务收费”的商业模式。
值得注意的是,2024年上半年,字节在豆包的广告投放上持续加码。仅4月至5月的投流金额就达到1500万至1750万元,而到6月上旬,这一数字飙升至1.24亿元,通过抖音、TikTok等流量入口实施饱和攻击,使得豆包在2024年上半年用户数量实现了大幅增长,从6月底的2751万跃升至11月的5600万。这种“以战养战”的打法,正在快速收割应用层红利。
阿里则选择了一条更“重”但更具壁垒的路径——在过去三年的3800亿元投入中,900亿元用于算力采购,700亿元建设IDC集群,其余投向模型研发。其通义千问开源模型衍生数量突破10万,形成全球最大的开源生态。这种战略的深层逻辑在于:通过开源降低企业使用门槛,再以云服务捕获商业价值,从而实现“采用通义模型的企业中,到多数都会选择购买阿里云服务”的目标,实现生态锁定效应。
DeepSeek则继续在追求极致工程优化,改写行业规则的道路上前行,其目前已与数十家云厂商集成其模型,形成“技术授权+算力分成”的独特商业模式。
面对巨头挤压,作为首家启动上市的大模型企业,智谱AI则选择了简单粗暴的价格战——将自己的GLM-4-Plus模型价格降至5元/百万token,降幅达90%,相当于每生成1亿汉字仅需500元,通过市场份额换取估值空间。
最后,拥有着上海国资背景的阶跃星辰则押注多模态融合。其Step系列模型涵盖文本、图像、视频、3D生成等16个模态,在动态语义理解指标上超越GPT-4o,并且在与吉利、OPPO等企业合作中,还尝试采取“模型即芯片”的终端部署模式,其车载AI助手已实现50ms级响应。但也需看到的是,这种全面布局需要持续输血——其B轮融资超5亿美元,创下2024年AI领域最高纪录。
未来之战,三大趋势重构产业逻辑
当行业发展进入深水区后,三个关键趋势的变化也正在显现:
首先是,基础大模型之间的竞争从参数竞赛到智能上限突破。行业焦点正从“万亿参数”转向“有效智能”。
具有代表性的例子,比如DeepSeek通过架构创新(如MoE稀疏激活),让千亿级模型可实现万亿级性能,再比如,阶跃星辰的“世界模型”这一多模态模型,已初步实现模拟物理交互。简而言之,行业逐渐认识到,AGI的钥匙在于提升模型的元认知与推理能力,而非单纯堆砌数据。
其次是从通用模型到垂直赛道的深耕。以字节和快手这两个大厂为例,字节跳动将大模型深度植入电商推荐系统,而快手可灵则发力短视频营销场景,据2024年财报显示,快手线上营销服务收入为724.19亿元,同比增长20.1%。快手在财报中解释称,主要是由于优化的智能营销解决方案及AI技术的应用,推动营销客户投放消耗增加。
最后,能效比正成为核心竞争力。DeepSeek的能效优化使其单次训练成本降至行业1/10,这种成本革命让中小企业可用原来1%的成本获取GPT-3级能力,从而在企业AI转型时,真正意义上落地降本增效。
商业化困局,技术理想与市场现实的撕裂
“理想很丰满 现实很骨感”
当下的“AI五强”在商业化探索上,正面临各自困境。
比如,虽然豆包以“烧钱换市场”策略(2024年Q2至2025年Q1,豆包季度平均投流费用为1.5225亿元。)快速登顶,但其C端变现路径尚不清晰。当前主要收入来自B端企业调用API,需依赖海量客户规模支撑。然而,中小企业对AI的实际需求多停留在“尝鲜”阶段,复购率存疑。
更严峻的是,字节的“App工厂”模式在AI时代遭遇挑战——猫箱、星绘等20余款应用看似热闹,却未能孵化出第二个“抖音级”爆款。此外,过度依赖广告投流的增长模式,与AGI时代“技术驱动自然增长”的逻辑存在根本冲突,一旦缩减预算,用户规模可能面临断崖式下跌。
而阿里的通过通义千问,虽然通过开源(衍生模型超10万)和云计算绑定(29万企业开发者调用API)构建生态,但开源模式的商业回报存在天然缺陷——企业用户倾向于免费使用基础模型,仅少数付费定制垂直模型。阿里云的收入增长更多来自算力租赁而非模型服务,这种“为他人作嫁衣”的困境,使其难以将量化大模型直接转化为商业价值。
与此同时,在内部协同方面,电商业务的AI改造(如淘宝智能搜索)效果尚未显现,更棘手的是,3800亿元的算力投入需要长期摊销,若AGI突破迟滞,可能面临投资回报率不达预期的压力。
快手的可灵AI,据官方信息显示,截至2025年2月,可灵AI在全球用户数已突破2200万(其中海外占比超80%),且自商业化以来(2024年Q3至2025年2月),累计营收突破1亿元人民币,实现了“视频生成+商业化”的快速破局,但核心技术缺陷制约长远发展。
作为五强中唯一冲刺IPO的创业公司,智谱的“政府+企业”客户结构暗藏风险——其MaaS平台主要的收入还是来源于To B方向,依赖政府采购和行业解决方案(如智慧城市、金融风控),但这类项目回款周期长、定制化成本高,或将导致一定的现金流压力。
此外,其C端布局薄弱(GLM-4V-Flash免费但用户量有限)使其错失消费级市场红利,而降价策略(GLM-4-Plus降90%)虽短期提振客户数,却也引发其毛利率的波动,资本市场对其“以价换量”模式的可持续性存疑。更关键的是,智能体产品(如AutoGLM)的规模化落地以及商业化验证,尚需时间检验。
最后则是DeepSeek,其技术突破主要服务于开发者生态,却缺乏直接盈利渠道,同时,团队“重研究轻运营”的风格导致市场敏感度低——当字节、阿里在消费端和企业端双线发力时,DeepSeek仍聚焦于代码生成、数学推理等窄众领域,未能抓住电商、教育等高频应用场景,尤其是在AGI时间表不明朗的情况下,资本耐心可能逐渐耗尽。
结语
在这场关乎未来的竞争中,没有永恒的王者,只有持续的创新。值得警惕的是,在狂热的技术追逐中,数据隐私、算法伦理、能源消耗等问题已悄然浮现。如何在创新与责任间找到平衡,或将决定这场竞赛的最终赢家。
(来源:钛媒体)