Token用量一年翻10倍难怪厂商要涨价

2026年03月20日,20时43分34秒机构观点阅读 35 views 次

受全球AI需求爆发、算力资源紧张及硬件成本上升驱动，大模型厂商与云服务厂商于近期集体涨价。

3月11日，腾讯云率先调整计费策略，混元系列模型Tencent HY2.0 Instruct输入价格从0.0008元/千Tokens涨至0.004505元/千Tokens，涨幅达463%；同时结束GLM 5、MiniMax等第三方模型的免费公测，转为正式商用。

3月16日，智谱推出新模型GLM-5-Turbo并上调API价格20%，较前代GLM-4.7平均涨幅达83%。

3月18日，阿里云与百度智能云同一天宣布涨价。根据官方公告，阿里云将对平头哥真武810E等算力卡相关服务、CPFS（智算版）等服务价格进行调整，涨幅最高达34%；百度智能云则明确AI算力相关产品服务价格上调约5%—30%，并行文件存储等价格上调约30%。两家云厂商均将涨价归因于“全球AI需求爆发”。

虽然全球AI的总体需求不易估算，但可以从全球最大API聚合平台OpenRouter披露的数据窥见一斑。据介绍，OpenRouter是一个聚合多家人工智能模型的API平台，普通用户和开发者都可以通过统一的接口来调用不同的LLM模型实现对话聊天，例如GPT-4、Claude、Gemini、Deepseek等。

OpenRouter披露的数据显示，2025年3月24日当周通过该平台调用大模型所使用的Token量为1.62万亿，而到了今年，3月9日当周这一用量已涨至16.90万亿，一年时间翻了10倍。特别的，自今年1月30日OpenClaw（“龙虾”）正式发布，Token使用量涨速更加明显。OpenClaw发布当周该平台Token用量为8.25万亿，之后仅一个多月这一数量就翻倍至16.90万亿。

银河证券研报表示，2026年3月首周平台处理量达14.8万亿Tokens，较年初一周翻倍，其中Agent驱动的工作流输出Token已超过平台总输出的一半。

此外，从3月9日当周具体Token用量来看，有四款国产大模型霸榜。MiniMax M2.5以1.75万亿排名第一，Step 3.5 Flash（阶跃星辰）和DeepSeek V3.2以1.34万亿和1.04万亿位列第二、第三，Kimi K2.5以0.56万亿排在第九。而且，自2月9日当周中国模型调用量首超美国后，MiniMax M2.5已连续5周排名第一。

虽然OpenRouter仅统计从平台走的调用，并未计算那些直接用原厂API的用户，但鉴于它全球最大API聚合平台的身份，仍能从这些数据中看出国产大模型的实力和巨大需求。

(来源:天天基金网)

2026年 6月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

关联资讯:

用户登录