阿里竞速Token工厂

2026年03月18日,10时37分04秒 科技新知 阅读 3 views 次

文 | 硬唠intalk

2026年3月17日,杭州,阿里园区。钉钉 CEO 陈航(无招)站在台上,发布了企业级 AI 原生平台“悟空”。就在 24 小时前,阿里巴巴宣布成立 Alibaba Token Hub(ATH)事业群。这个新组织由集团 CEO 吴泳铭亲自挂帅,将通义实验室、MaaS 业务线及千问、悟空等事业部悉数收编。

这是阿里在 48 小时内连续打出的两枚重炮。台下的观众并不知道,此时距离阿里最年轻的技术领袖林俊旸在 X 平台发布那条“7 个单词”的离职推文,仅过去了 13 天。当“悟空”抡起金箍棒时,阿里正试图用一套精确到 Token 的工业流水线,重新定义这场战争的打法。

吴泳铭的账本:从“技术殿堂”到“Token工厂

在大模型的技术浪漫主义时代,参数量和榜单排名曾是唯一的度量衡。但在吴泳铭的账本里,衡量 AI 竞争力的核心指标正在发生质变:Token 的生产与消耗能力。新成立的 ATH 事业群,其命名方式带有一种精算师般的务实。

吴泳铭在内部信中将新事业群的使命浓缩为三个环节:

「创造 Token、输送 Token、应用 Token」

在这种架构下,通义实验室不再是独立的技术象牙塔,而是被定位为 Token 的“发电厂”。MaaS 业务线则是负责分发的“电网”;而悟空和千问,则是直接接入终端的“电器”。这种垂直整合的意图在于终结阿里内部的“割据”状态。

此前,阿里的 AI 版图呈现出某种结构性错位。负责底层研发的通义实验室与负责前端应用的业务线之间,缺乏统一的协同机制。林俊旸时期的 Qwen 团队更像是一个独立的“军械库”,前线应用能拿到什么武器,往往取决于实验室的技术偏好。

当开源的掌声无法直接转化为财报上的确定性利润时,吴泳铭选择了向内挥刀。他提出的“Token 枢纽”逻辑,本质上是将 AI 研发从实验室阶段推向工业化流水线。在 ATH 的架构中,Token 被视作新时代的“水电煤”,甚至是算力时代的“计件工资”。

每一条工作流的调用、每一个指令的执行,都被纳入了可计价、可追踪的商业闭环。

截至 2026 财年 Q2,阿里云 AI 相关收入已连续 9 个季度实现三位数增长。但面对字节跳动 Seed 团队的庞大规模以及 DeepSeek 掀起的效率风暴,阿里必须证明,这种“全栈整合”的工业效率,能够跑赢天才个体的爆发力。

挖角与反围剿:字节 Seed 团队的 2000 人阴影

在阿里内部,Qwen 团队曾被戏称为“军情六处 Q 部门”。这个比喻带有某种技术精英主义的自豪:一个规模极度精简的小团队,依靠天才爆发力,向全球输出开源模型。但当 2026 年初,大模型战争进入从“实验”向“工程”转型的深水区时,这种“特工”模式遭遇了来自字节跳动的结构性重压。

2000 人,这是 36 氪披露的字节跳动负责基础模型训练的 Seed 团队规模。

相比之下,阿里 Qwen 在各个研发方向上投入的绝对人数,仅是友商的几分之一。人才的流动更像是一场无声的失血。

早在 2024 年,原 Qwen 核心负责人周畅离职加入字节 Seed,并带走了十多名核心骨干。到了 2026 年 3 月,这种趋势并未止步。林俊旸官宣离职的同一周,Qwen 后训练负责人郁博文确认加盟字节。他出任 Seed 团队“多模态交互与世界模型”部门的后训练负责人。

字节的逻辑简单而粗暴:将模型彻底产品化。截至 2025 年 12 月,字节旗下的豆包日活跃用户(DAU)已率先破亿,并在各个细分赛道上线了超过 20 款 AI 应用。当阿里的技术天才们还在纠结如何维持实验室的“独立性”时,字节已经通过庞大的工程团队,将 Seed 模型家族转化为社交、视频、办公全场景的流量收割机。

这种规模差距直接体现在了基础设施的建设速度上。数位 Qwen 内部人士曾向媒体坦言,团队在算力资源和 Infra(基础设施)建设上长期缺乏足够的资源支持。当林俊旸在 X 平台代言 Qwen、在国际开源社区赢得掌声时,他背后的团队正面临着一种结构性的不兼容。

管理层希望通过拆分团队、引入空降兵来降低对单一个体的依赖。而技术天才们则认为这正在扼杀创新灵光。对阿里而言,林俊旸和郁博文的离职,不仅是两个 P10 级人才的流失,更揭示了一个残酷的现实。

在 AI 竞赛进入工业化对垒的下半场,仅靠几个天才的爆发力,已很难在 2000 人的建制化阵列面前守住护城河。

第三章:周浩时刻

2026年1月,当林俊旸还在为Qwen的开源版图全力冲刺时,一位低调的空降兵走进了阿里园区。他叫周浩,第一站并非通义实验室,而是挂靠在夸克。这位科学家本科毕业于中科大,此前的身份是 Google DeepMind 高级主任研究科学家。

周浩的加盟,标志着Qwen技术路线的一次底层转向。在林俊旸主导的Qwen宇宙中,核心追求是“全栈、开源、影响力”。Qwen通过频繁的迭代和庞大的尺寸覆盖,在LMSYS等榜单上建立了国产模型的高地。

但这种路径本质上仍是基于“海量数据+巨量算力”的概率预测。当DeepSeek通过强化学习(RL)证明了“推理成本”优于“参数堆砌”时,阿里的技术焦虑点发生了偏移。周浩带给阿里的是DeepMind式的“慢思考”逻辑。

作为Gemini强化学习与自我改进团队的负责人,周浩在Google的核心贡献是让AI学会“想好了再说”。他参与研发的Gemini DeepThink模式,通过专门的奖励函数,让模型在生成每一个Token时都内化事实准确性约束。

随着林俊旸和郁博文的离职,周浩从幕后走向前台,接手后训练的核心职能。阿里的意图十分明确:Qwen需要从一个语言模型,进化为具备自主推理能力的智能体。

2026年3月,阿里在重组ATH的同时,发布了Qwen3-Max-Thinking的技术博客。该模型在逻辑推理与复杂指令遵循上的提升,直接对标GPT-5.4与DeepSeek V3.2。对于阿里而言,这不仅是人才的更迭,更是一场生存策略的调整。

在算法效率超越算力规模的新竞赛中,必须用科学家的“精算”来填补天才离职后的战力空白。

第四章:“悟空”下场:Agent 战场的贴身肉搏

2026 年 3 月 17 日,ATH 事业群成立的第二天,阿里发布了名为“悟空”的企业级 Agent 平台。

陈航在发布会上说:

「过去 11 年,钉钉改变了我们的工作方式,今天,悟空正在尝试定义 AI 时代全新的工作方式。」

“悟空”的出现,标志着阿里正式从“卖模型”转向“卖劳动力”。当市面上的 AI 智能体大多还在充当“陪聊龙虾”时,阿里的技术团队将钉钉彻底打碎重组。他们为 AI 设计了一套名为 RealDoc 的原生文件系统。

传统文件系统是为人类阅读设计的,保存的是最终结果。而 RealDoc 保存的是推理过程、决策链条和上下文快照。这意味着,当一个 AI 员工在悟空平台上处理合同或分析财报时,它不再需要把整篇文档读入显存。

它可以像外科医生一样,通过 CLI 直接定位到具体的行或原子级数据进行操作。这种重构让 Token 的吞吐量提升了 5 倍,能效提升了 4 倍。在阿里的逻辑中,Agent 不再是挂在 App 上的插件,而是直接生长在企业组织架构里的“数字员工”。

通过与钉钉超 2000 万企业组织的深度绑定,悟空可以直接调取权限、连接业务系统。这种贴身肉搏的姿态,不仅是对字节跳动路径的回应,更是对 DeepSeek 效率竞赛的防御。

阿里正试图通过建立一套完整的“Token 供应链”,将 AI 竞争从算法的灵光一现,拉入到比拼工业厚度与商业落地成本的阵地战中。

末章

阿里云的财报显示,截至 2026 财年 Q2,AI 相关收入已连续 9 个季度实现三位数增长。公共云收入达到 398.24 亿元,同比增长 34%。而在林俊旸离职的那天,他在朋友圈分享了一首歌的链接。

他在朋友圈写道:

「要加油啊,坤坤!还有很多事情没做呢。」

在这场关于 Token 的权杖争夺战中,有人选择了离开实验室去寻找新的自由。而留下来的人,则必须学会像工厂主一样精算每一毫秒的算力与每一位 Token 的盈余。

(来源:钛媒体)



用户登录