全球AI工厂4万亿激战！这家国产厂商领先一个身位了

2026年05月27日,20时38分41秒科技新知阅读 4 views 次

作者 | 李水青

编辑 | 漠影

一场围绕Agent的全球基建竞赛，已跨越不可逆的临界点。

全球权威研究机构Omdia最新报告预测，2026年，全球科技巨头在AI基础设施上的资本支出将超过6000亿美元（约合4.07万亿元人民币），规模堪比一个世纪前的工业电气化革命。

国际AI巨头纷纷斥重资打造AI工厂。OpenAI刚刚披露，其2026年全年算力预算500亿美元，并牵头千亿级 “星际之门” 超级算力工厂；Anthropic先后与谷歌、亚马逊达成数百亿美元算力及投资合作，租赁SpaceX大型超算作为推理算力工厂，同时投入500亿美元自建数据中心集群……

当英伟达CEO黄仁勋断言“AI不是软件，而是工厂”，微软CEO纳德拉将Azure重构成“全球最大的AI工厂网络”，产业竞争的焦点已不是模型，而是能否稳定、低成本、规模化地“生产智能”。

Omdia这份名为《2026全球AI工厂市场格局》的报告，点明了新时代的核心逻辑——决定胜负的，不再是谁拥有更多GPU，而是谁能够更高效地把“电力+算力+数据”转化为真正有价值的Token。

更值得关注的是，这份报告首次系统性梳理了全球AI工厂玩家的不同路径。其中，一个来自中国的样本，被Omdia单独定义为“智能精炼（Intelligence Refiner）”范式的代表——商汤大装置。

全球AI工厂4万亿激战！这家国产厂商领先一个身位了

Omdia报告截图

与此同时，IDC最新中国企业级MaaS市场报告显示，商汤大装置“万象”大模型平台凭借11.3%的市场份额，位居中国大模型平台私有化市场第二，跻身行业第一梯队。

当下正值OpenAI、Anthropic等全球AI巨头纷纷杀入企业级服务市场，竞赛的号角吹响，国产厂商如何守住阵地并向外围突破？商汤大装置凭什么被国际权威机构盖章认证为“开创者”？

智东西结合Omdia报告，并独家对话商汤大装置解决方案总经理代继，试图从产业最前线拆解：AI工厂为什么突然爆火，以及一家中国企业如何提前卡位这场新基础设施竞赛。

一、AI工厂爆火：从训练模型到生产智能，“精炼师”登场

AI工厂为什么会在今年突然爆火？

代继给出的答案很直接：因为Agent真正逼近了产业爆发临界点，AI产业的水位变了。

过去两年，行业更关注模型训练，重点始终是“大模型能力够不够强”，刷榜快不快；如今随着Agent加速落地，越来越多企业开始发现，真正消耗海量资源的其实是推理阶段。训练可能只发生一次，但推理会长期持续发生。未来80%以上的算力消耗，都可能来自推理与Agent运行。

这意味着，AI产业开始从一次性研发逻辑，转向持续性的工业化运营逻辑。企业开始关心新的问题：模型已经足够聪明，如何把它变成稳定、可控、可规模化的AI生产系统？

这也正是AI工厂概念迅速升温的核心原因。

根据Omdia报告的定义，传统数据中心，本质上是在提供服务器、存储与网络资源；AIDC（智算中心）则主要提供GPU算力；而AI工厂输出的，已经不再只是“计算资源”，而是企业级AI能力、智能体与Token生产能力。

而一旦进入AI工业化运营逻辑，企业开始关心的不再只是模型性能参数，而是：单位Token成本到底是多少？GPU利用率能不能持续提升？多种国产芯片能否混合运行？推理与训练能否动态调度？电力成本是否还能压缩？Agent失控时如何保障业务安全？等等。

这些问题，本质上都是基础设施问题。

Omdia在报告中明确指出，AI工厂已经不是传统数据中心的升级版，而是一种“以生产智能为目标的新型工业基础设施”。

全球科技产业的重心，也开始集体向这里迁移。

一边是海外巨头全面加码。英伟达、微软、亚马逊、谷歌持续扩张AI基础设施；另一边，中国市场也正在进入AI工厂建设高峰期。特别是在金融、政务、能源、制造等行业，越来越多企业开始推进私有化AI工厂建设。

全球AI工厂市场随之演变出了不同类型的核心参与者：有卖“盒子”的一站式私有AI底座商，有卖端到端服务的全栈公有云巨头，有卖极致性能的算力原生AI云，也有卖本地化服务的区域运营商。竞争的焦点在于，谁能把Token的价值密度做得更高，谁就有望占据优势生态位。

全球AI工厂4万亿激战！这家国产厂商领先一个身位了

全球AI工厂市场演变出了四类核心玩家群体

在激烈的角逐中，Omdia之所以将商汤大装置推举为“智能精炼范式”的开创者，核心在于其率先完成了从“算力生产能源公司”向“企业级智能制造工厂”的进化。

所谓“智能精炼”，本质上是通过一套围绕模型生产和智能输出构建的完整系统工程，形成“智能生产线” 的运行模式，把原始算力、推理服务、数据处理、模型测评、算力调度等融合，最终实现更高效的Token生产。代继告诉智东西，商汤大装置是在这一领域最早布局的代表玩家之一。

全球AI工厂4万亿激战！这家国产厂商领先一个身位了

商汤临港智算中心

二、为什么是商汤大装置？五层架构，把算力数据炼成生产力

事实上，商汤布局AI工厂，并不是今年才开始。

早在2022年，行业还在讨论“大模型到底有没有商业价值”时，商汤内部就已经提出“AI数字工厂”构想。

过去几年，商汤大装置逐渐形成了一套完整的“五层架构”。而这套架构，本质上也是围绕AI工厂落地过程中最棘手的问题逐层展开。

全球AI工厂4万亿激战！这家国产厂商领先一个身位了

商汤大装置AI工厂架构

1、能源与物理层：联手“宁王”，先解决“电老虎”痛点

AI工厂首先面对的，是能源问题。

AI时代的数据中心，耗电量远超传统IDC。尤其在推理规模持续爆发之后，电力已经开始成为AI工厂最核心的运营成本之一。因此，AI工厂的竞争，首先是能源的竞争。

为此，商汤大装置与宁德时代合作，在临港AIDC落地算电协同平台：其核心目标是通过电力预测、储能调度与负载优化，让整个AI工厂运行效率最大化。

Omdia数据显示，该系统能源预测准确率达到88%，决策准确率达到93%，PUE降至1.265，年节约电费约7%，碳减排每万P 4000吨。

在AI进入高耗能时代后，“电”已经不再是辅助资源，而是AI工厂核心生产资料的一部分。

2、异构算力层：真正难啃的，是国产芯片碎片化

如果说能源是AI工厂的血液，那么异构芯片协同，就是最难打通的神经系统。

代继向智东西坦言，五层架构里最难的一层，就是异构算力层。原因很简单：国产芯片生态高度碎片化。每一家国产AI芯片或GPU厂商，几乎都是一个“黑盒”。不同芯片拥有不同通信协议、不同调度方式、不同硬件架构，很难通过统一方法实现协同。

而现实情况是，很多大型企业内部，本身就已经采购了多个品牌AI芯片。“每个客户基本都会有一点。”代继说，“你必须帮他把这些东西真正协同起来。”

据了解，商汤大装置率先实现了万卡级国产GPU集群异构混训。Omdia数据显示，其异构训练效率已达到同构训练95%的水平。这意味着，客户无需再过多关注不同芯片之间的适配与调度问题，商汤在底层就把这些碎片化问题解决了。

而这背后，是长期底层优化积累。代继透露，很多国产AI芯片优化，往往需要针对具体超级节点、交换机结构、通信协议逐层写代码调优。不是把任务拉起来跑就行，而是你得知道每一层瓶颈在哪里，不断调到最优值。

这种能力，很难通过短期堆资源获得。

3、调度平台层：AI工厂最大的浪费，是GPU闲着

AI工厂需要同时服务训练和推理两种截然不同的工作负载，需要“训推共池”。

过去很多训练集群，一旦训练结束，大量GPU会出现空转；推理系统则可能在高峰期爆满、低谷期闲置。如何在同一资源池中实现两者的高效共存，避免资源浪费同时保障SLA，是全行业的共同难题。

为此，商汤大装置通过自研训练框架，开发并优化多种并行策略，提升训练性能和显存管理，另外，支持开源vLLM及自研LightLLM双推理引擎，极大提升推理效率并压低推理成本。

本质上，AI工厂已经越来越像现代工业流水线。对于金融、政务等对稳定性要求极高的客户而言，这一层直接决定了AI能力能否进入核心生产环节。

4、MaaS层：模型正在变成开放部署的“工业零部件”

在模型层，行业也发生了明显变化。

过去，大模型公司普遍希望通过闭源模型建立壁垒；但随着开源模型快速成熟，行业开始意识到模型本身，正在逐渐变成标准化能力。

商汤大装置的MaaS层，不是单纯提供自研模型，而是整合“日日新”与大量第三方开源模型，形成统一调用平台，提供模型部署、模型推理、Agent开发能力等。

企业面对琳琅满目的开源模型和商业模型，往往不知道如何选择、如何调优、如何部署模型，商汤的MaaS层整合了“日日新”大模型及第三方开源模型，提供一站式模型服务，让企业可以从海量选项中抽身，聚焦于自身业务逻辑。

模型，正在从“明星产品”变成开放选项的“工业零部件”。

5、产业应用层：真正有价值的，是场景化Token

而五层架构里，最接近业务价值的一层是应用层，也是客户获得感最强的层面。

代继认为，企业真正需要的不是“通用Token”，而是“场景化Token”。也就是说，这个Token必须具备行业理解能力，结合了结合AIGC、具身智能、AI4S等场景的高浓度产业知识，从而成为真正理解业务流程、专业知识与安全边界的智能系统。

商汤过去十几年积累的大量产业经验，也开始在这一层形成复利。

例如，其与铁一院打造铁路设计首个多模态大模型，贯通28个专业知识，测试准确率超90%；与上海市规划资源局共建6000亿参数的“云宇星空”大模型，构建“1+6”模型体系，精准支撑复杂的城市空间治理。

“云宇星空”大模型应用界面

代继告诉智东西，相比纯SaaS层的后来者，商汤大装置拥有更深的物理层控制力，它是智能的“原始生产商”，交付成本更低、稳定性更强。而相比传统云厂商，商汤大装置又是AI原生的，没有历史包袱。

三、OpenAI、Anthropic刚下场，中国厂商已提前卡位“场景化Token”

近期，Anthropic与黑石成立AI原生企业服务公司，OpenAI也设立新公司杀入企业级部署。当模型巨头们纷纷从线上走向线下，商汤大装置的护城河在哪里？

代继告诉智东西，核心还在于“场景化Token”。

他谈道，企业级AI与消费级AI有较大区别。制造、能源、交通、城市治理等传统行业客户往往缺少AI技术团队，或技术人才储备不足，难以直接把GPU和模型转化为生产力。从基础设施到业务价值之间，存在一条极长的落地鸿沟。而真正决定企业AI成败的，往往是行业Know-How、部署能力与场景理解。

这也是为什么，OpenAI和Anthropic开始大量招聘行业专家，并向FDE（前沿部署工程师）模式靠拢。但当这些巨头刚刚开始敲门，商汤大装置早已提前在门内布局。

过去十几年，商汤在智慧城市、医疗、交通、具身智能、AIGC等领域积累的大量行业知识，被重新萃取、嵌入模型与服务体系之中。最终，客户调用的已经不是一个“裸模型”，而是一套具备场景理解能力的智能能力。

这也正切中当前企业市场最核心的变化。国内各行业客户的核心诉求尤为鲜明：强调全掌控、私有化、可控、安全、深度参与。

代继透露，目前国内增长最快的，仍然是私有化AI工厂。因为企业并不希望AI成为一个无法掌控的黑盒。“如果你用这套系统驱动核心业务，一旦失控，整个产线都可能挂掉。”他说。

因此，未来企业AI大概率不会是完全自主Agent，而会是“Agent + Workflow”的混合架构。

在企业服务商业模式的探索上，美国数据巨头Palantir依靠FDE（前沿部署工程师）模式斩获的高速增长震动了业界。代继坦言，商汤大装置目前的进化逻辑与Palantir不谋而合，正重点推动FDE深度赋能模式，集中重兵突破头部的Key Account（大客户）。

这也从行业角度，解释了为什么AI工厂最终会越来越像工业系统，而非互联网产品。

从金融行业的碎片化算力整合，到与上海市规划资源局共建的6000亿参数的政务大模型，再到企业核心业务中的可控Agent体系，商汤大装置正在通过一次次高复杂度项目，把自己的“原生AI云 + 深刻场景理解”融入AI工厂，修筑起一道难以逾越的护城河。

结语：2030年的AI赢家，属于今天的“智能精炼师”

Omdia预测，到2030年，全球数据中心市场累计投资将接近1.6万亿美元。资本正从“买算力”转向“建工厂”，这场竞赛的终局，将是能源、算力、算法、场景与服务的系统性角力。

OpenAI与Anthropic的入场，印证了企业级AI市场的巨大引力。而商汤大装置凭借其前瞻布局的“AI数字工厂”五层架构，包括硬核的算电协同与异构混训能力，以及深入产业肌理的“智能精炼”范式，已在这场全球性的基础设施重构中，率先卡住了生态位。

正如黄仁勋所言，AI模型可以复制，但AI工厂不能。那些率先成为“智能精炼师”的先行者，有望定义下一个时代的产业格局。

(来源：新浪科技)

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

关联资讯:

用户登录