阿里竞速Token工厂

2026年03月18日,10时37分04秒科技新知阅读 21 views 次

文 | 硬唠intalk

2026年3月17日，杭州，阿里园区。钉钉 CEO 陈航（无招）站在台上，发布了企业级 AI 原生平台“悟空”。就在 24 小时前，阿里巴巴宣布成立 Alibaba Token Hub（ATH）事业群。这个新组织由集团 CEO 吴泳铭亲自挂帅，将通义实验室、MaaS 业务线及千问、悟空等事业部悉数收编。

这是阿里在 48 小时内连续打出的两枚重炮。台下的观众并不知道，此时距离阿里最年轻的技术领袖林俊旸在 X 平台发布那条“7 个单词”的离职推文，仅过去了 13 天。当“悟空”抡起金箍棒时，阿里正试图用一套精确到 Token 的工业流水线，重新定义这场战争的打法。

吴泳铭的账本：从“技术殿堂”到“Token工厂”

在大模型的技术浪漫主义时代，参数量和榜单排名曾是唯一的度量衡。但在吴泳铭的账本里，衡量 AI 竞争力的核心指标正在发生质变：Token 的生产与消耗能力。新成立的 ATH 事业群，其命名方式带有一种精算师般的务实。

吴泳铭在内部信中将新事业群的使命浓缩为三个环节：

「创造 Token、输送 Token、应用 Token」

在这种架构下，通义实验室不再是独立的技术象牙塔，而是被定位为 Token 的“发电厂”。MaaS 业务线则是负责分发的“电网”；而悟空和千问，则是直接接入终端的“电器”。这种垂直整合的意图在于终结阿里内部的“割据”状态。

此前，阿里的 AI 版图呈现出某种结构性错位。负责底层研发的通义实验室与负责前端应用的业务线之间，缺乏统一的协同机制。林俊旸时期的 Qwen 团队更像是一个独立的“军械库”，前线应用能拿到什么武器，往往取决于实验室的技术偏好。

当开源的掌声无法直接转化为财报上的确定性利润时，吴泳铭选择了向内挥刀。他提出的“Token 枢纽”逻辑，本质上是将 AI 研发从实验室阶段推向工业化流水线。在 ATH 的架构中，Token 被视作新时代的“水电煤”，甚至是算力时代的“计件工资”。

每一条工作流的调用、每一个指令的执行，都被纳入了可计价、可追踪的商业闭环。

截至 2026 财年 Q2，阿里云 AI 相关收入已连续 9 个季度实现三位数增长。但面对字节跳动 Seed 团队的庞大规模以及 DeepSeek 掀起的效率风暴，阿里必须证明，这种“全栈整合”的工业效率，能够跑赢天才个体的爆发力。

挖角与反围剿：字节 Seed 团队的 2000 人阴影

在阿里内部，Qwen 团队曾被戏称为“军情六处 Q 部门”。这个比喻带有某种技术精英主义的自豪：一个规模极度精简的小团队，依靠天才爆发力，向全球输出开源模型。但当 2026 年初，大模型战争进入从“实验”向“工程”转型的深水区时，这种“特工”模式遭遇了来自字节跳动的结构性重压。

2000 人，这是 36 氪披露的字节跳动负责基础模型训练的 Seed 团队规模。

相比之下，阿里 Qwen 在各个研发方向上投入的绝对人数，仅是友商的几分之一。人才的流动更像是一场无声的失血。

早在 2024 年，原 Qwen 核心负责人周畅离职加入字节 Seed，并带走了十多名核心骨干。到了 2026 年 3 月，这种趋势并未止步。林俊旸官宣离职的同一周，Qwen 后训练负责人郁博文确认加盟字节。他出任 Seed 团队“多模态交互与世界模型”部门的后训练负责人。

字节的逻辑简单而粗暴：将模型彻底产品化。截至 2025 年 12 月，字节旗下的豆包日活跃用户（DAU）已率先破亿，并在各个细分赛道上线了超过 20 款 AI 应用。当阿里的技术天才们还在纠结如何维持实验室的“独立性”时，字节已经通过庞大的工程团队，将 Seed 模型家族转化为社交、视频、办公全场景的流量收割机。

这种规模差距直接体现在了基础设施的建设速度上。数位 Qwen 内部人士曾向媒体坦言，团队在算力资源和 Infra（基础设施）建设上长期缺乏足够的资源支持。当林俊旸在 X 平台代言 Qwen、在国际开源社区赢得掌声时，他背后的团队正面临着一种结构性的不兼容。

管理层希望通过拆分团队、引入空降兵来降低对单一个体的依赖。而技术天才们则认为这正在扼杀创新灵光。对阿里而言，林俊旸和郁博文的离职，不仅是两个 P10 级人才的流失，更揭示了一个残酷的现实。

在 AI 竞赛进入工业化对垒的下半场，仅靠几个天才的爆发力，已很难在 2000 人的建制化阵列面前守住护城河。

第三章：周浩时刻

2026年1月，当林俊旸还在为Qwen的开源版图全力冲刺时，一位低调的空降兵走进了阿里园区。他叫周浩，第一站并非通义实验室，而是挂靠在夸克。这位科学家本科毕业于中科大，此前的身份是 Google DeepMind 高级主任研究科学家。

周浩的加盟，标志着Qwen技术路线的一次底层转向。在林俊旸主导的Qwen宇宙中，核心追求是“全栈、开源、影响力”。Qwen通过频繁的迭代和庞大的尺寸覆盖，在LMSYS等榜单上建立了国产模型的高地。

但这种路径本质上仍是基于“海量数据+巨量算力”的概率预测。当DeepSeek通过强化学习（RL）证明了“推理成本”优于“参数堆砌”时，阿里的技术焦虑点发生了偏移。周浩带给阿里的是DeepMind式的“慢思考”逻辑。

作为Gemini强化学习与自我改进团队的负责人，周浩在Google的核心贡献是让AI学会“想好了再说”。他参与研发的Gemini DeepThink模式，通过专门的奖励函数，让模型在生成每一个Token时都内化事实准确性约束。

随着林俊旸和郁博文的离职，周浩从幕后走向前台，接手后训练的核心职能。阿里的意图十分明确：Qwen需要从一个语言模型，进化为具备自主推理能力的智能体。

2026年3月，阿里在重组ATH的同时，发布了Qwen3-Max-Thinking的技术博客。该模型在逻辑推理与复杂指令遵循上的提升，直接对标GPT-5.4与DeepSeek V3.2。对于阿里而言，这不仅是人才的更迭，更是一场生存策略的调整。

在算法效率超越算力规模的新竞赛中，必须用科学家的“精算”来填补天才离职后的战力空白。

第四章：“悟空”下场：Agent 战场的贴身肉搏

2026 年 3 月 17 日，ATH 事业群成立的第二天，阿里发布了名为“悟空”的企业级 Agent 平台。

陈航在发布会上说：

「过去 11 年，钉钉改变了我们的工作方式，今天，悟空正在尝试定义 AI 时代全新的工作方式。」

“悟空”的出现，标志着阿里正式从“卖模型”转向“卖劳动力”。当市面上的 AI 智能体大多还在充当“陪聊龙虾”时，阿里的技术团队将钉钉彻底打碎重组。他们为 AI 设计了一套名为 RealDoc 的原生文件系统。

传统文件系统是为人类阅读设计的，保存的是最终结果。而 RealDoc 保存的是推理过程、决策链条和上下文快照。这意味着，当一个 AI 员工在悟空平台上处理合同或分析财报时，它不再需要把整篇文档读入显存。

它可以像外科医生一样，通过 CLI 直接定位到具体的行或原子级数据进行操作。这种重构让 Token 的吞吐量提升了 5 倍，能效提升了 4 倍。在阿里的逻辑中，Agent 不再是挂在 App 上的插件，而是直接生长在企业组织架构里的“数字员工”。

通过与钉钉超 2000 万企业组织的深度绑定，悟空可以直接调取权限、连接业务系统。这种贴身肉搏的姿态，不仅是对字节跳动路径的回应，更是对 DeepSeek 效率竞赛的防御。

阿里正试图通过建立一套完整的“Token 供应链”，将 AI 竞争从算法的灵光一现，拉入到比拼工业厚度与商业落地成本的阵地战中。

末章

阿里云的财报显示，截至 2026 财年 Q2，AI 相关收入已连续 9 个季度实现三位数增长。公共云收入达到 398.24 亿元，同比增长 34%。而在林俊旸离职的那天，他在朋友圈分享了一首歌的链接。

他在朋友圈写道：

「要加油啊，坤坤！还有很多事情没做呢。」

在这场关于 Token 的权杖争夺战中，有人选择了离开实验室去寻找新的自由。而留下来的人，则必须学会像工厂主一样精算每一毫秒的算力与每一位 Token 的盈余。

(来源：钛媒体)

2026年 5月
一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

吴泳铭的账本：从“技术殿堂”到“Token工厂”

挖角与反围剿：字节 Seed 团队的 2000 人阴影

第三章：周浩时刻

第四章：“悟空”下场：Agent 战场的贴身肉搏

末章

关联资讯:

用户登录