Token用量一年翻10倍 难怪厂商要涨价

受全球AI需求爆发、算力资源紧张及硬件成本上升驱动,大模型厂商与云服务厂商于近期集体涨价。
3月11日,腾讯云率先调整计费策略,混元系列模型Tencent HY2.0 Instruct输入价格从0.0008元/千Tokens涨至0.004505元/千Tokens,涨幅达463%;同时结束GLM 5、MiniMax等第三方模型的免费公测,转为正式商用。
3月16日,智谱推出新模型GLM-5-Turbo并上调API价格20%,较前代GLM-4.7平均涨幅达83%。
3月18日,阿里云与百度智能云同一天宣布涨价。根据官方公告,阿里云将对平头哥真武810E等算力卡相关服务、CPFS(智算版)等服务价格进行调整,涨幅最高达34%;百度智能云则明确AI算力相关产品服务价格上调约5%—30%,并行文件存储等价格上调约30%。两家云厂商均将涨价归因于“全球AI需求爆发”。
虽然全球AI的总体需求不易估算,但可以从全球最大API聚合平台OpenRouter披露的数据窥见一斑。据介绍,OpenRouter是一个聚合多家人工智能模型的API平台,普通用户和开发者都可以通过统一的接口来调用不同的LLM模型实现对话聊天,例如GPT-4、Claude、Gemini、Deepseek等。
OpenRouter披露的数据显示,2025年3月24日当周通过该平台调用大模型所使用的Token量为1.62万亿,而到了今年,3月9日当周这一用量已涨至16.90万亿,一年时间翻了10倍。特别的,自今年1月30日OpenClaw(“龙虾”)正式发布,Token使用量涨速更加明显。OpenClaw发布当周该平台Token用量为8.25万亿,之后仅一个多月这一数量就翻倍至16.90万亿。
银河证券研报表示,2026年3月首周平台处理量达14.8万亿Tokens,较年初一周翻倍,其中Agent驱动的工作流输出Token已超过平台总输出的一半。
此外,从3月9日当周具体Token用量来看,有四款国产大模型霸榜。MiniMax M2.5以1.75万亿排名第一,Step 3.5 Flash(阶跃星辰)和DeepSeek V3.2以1.34万亿和1.04万亿位列第二、第三,Kimi K2.5以0.56万亿排在第九。而且,自2月9日当周中国模型调用量首超美国后,MiniMax M2.5已连续5周排名第一。
虽然OpenRouter仅统计从平台走的调用,并未计算那些直接用原厂API的用户,但鉴于它全球最大API聚合平台的身份,仍能从这些数据中看出国产大模型的实力和巨大需求。
(来源:天天基金网)

