算力效能的最大杠杆:新华三为AGI时代铺就“无损联接”之路

2025年09月16日,12时40分32秒 科技新知 阅读 2 views 次

新华三的动作越来越快。

今年以来,新华三几乎每隔几个月就有重大产品发布。在刚刚结束的第九届未来网络发展大会,新华三发布了基于最新102.4T芯片研发的高性能800G AI交换机H3C S9828-128EP。

仅仅在一个多月前,新华三才在2025世界人工智能大会上,发布了面向万亿级参数模型训推场景的超节点产品H3C UniPoD S80000。今年早些时候,新华三还发布了基于DDC(Diversified Dynamic-Connectivity,多元动态联接)架构的新一代无损网络解决方案……

在这些令人目不暇接的产品背后,一条清晰的战略主线贯穿始终:新华三正以“算力×联接”为核心战略,从硬件适配、架构创新到生态协同,新华三正通过持续升级的全栈技术能力与极致迭代的产品演进,构建一个高效、开放、多元的智算生态。

算力洪流下的网络堰塞湖

我们正目睹一场史无前例的算力竞赛。

全球范围内,大模型正保持着惊人的演进速度,模型参数规模从万亿级向十万亿级,甚至数十万亿级跃进。参数规模与训练数据量的指数级增长,对计算基础设施提出了异常残酷的要求。

一方面,各地智算中心的建设如火如荼,另一方面,越来越多的运营者却陷入了“规模不经济”的怪圈,GPU数量线性增加,整体算力利用率却难以突破那道隐形的天花板,导致投资回报率不升反降。

繁荣下的隐痛,根源在于传统网络架构,在应对AI训练所需的“大象流”(Elephant Flow)时力不从心。网络延迟、抖动和拥塞,让昂贵的GPU常常处于等待数据的空闲状态,计算效率被无情损耗。

算力的洪流,正遭遇网络与联接的“堰塞湖”。根据业界经验,一台搭载千张H100 GPU的集群,单日停机成本便高达约30万元。

更深层的挑战来自于当下的生态现实,随着国产化进程加速,CPU、GPU、网卡来源日益多元。当同一座机房内,涌入大量技术路径迥异的不同产品,便不可避免地产生了巨大的互联互通与性能调优挑战。

若将智算中心想象为一座典雅堂皇的音乐厅,那么这座音乐厅内仅仅拥有世界级的小提琴、大提琴、长笛与钢琴演奏者,显然并不足以保证呈现一场世界级的演奏,他们还缺乏一位优秀的指挥。

新华三集团高级副总裁、网络产品线总裁乔剡在大会演讲中表示:“网络仅占智算中心整体投资约10%,但其性能的优劣,却能造成高达约30%的训练性能波动和25%的模型训练用时差异。这已非简单的成本问题,而是一个关乎AI研发效率与核心竞争力的战略问题。”

算力效能的最大杠杆:新华三为AGI时代铺就“无损联接”之路

新华三集团高级副总裁、网络产品线总裁乔剡发表主题演讲

重构“联接”价值,系统哲学下的创新范式

面对痛点,新华三的破题之道是“算力×联接”。

经典的系统论思想,强调将事物看作一个有机整体,追求的是系统全局效能的最优化,而非单个组件性能的极致。其实这一哲学在计算机科学中有着属于自己的专有名词——“阿姆达尔定律(Amdahl’s Law)”,该定律指出,计算系统整体性能的提升,受限于其最薄弱环节的改进速度。

当算力以指数级的速度狂飙时,模型参数对硬件数量的非线性关系必然使传统网络弹性面临前所未有的挑战。大模型未出现之前,不同业务之间的流量是10G、20G的差别,如今的均衡差别可能是上百G,导致按流负载会出现大面积不均衡的情况,产生拥塞和丢包,影响整个模型的效率,消耗过多的网络带宽和训练时间。

事实就是,在传统计算网络架构已触摸到性能天花板的现实面前,行业的一个共识正变得愈发清晰:算力的未来演进,不仅仅取决于单个芯片的性能强弱,更取决于这些算力单元之间如何高效、无损地“对话”。

联接,已经成为那个制约万亿级算力释放的关键瓶颈。甚至可以说,联接能力决定算力效率。

业界并非无人看到联接这一巨大的效率杠杆,非不为也,实不能也。

正如乔剡所言:“有些公司擅长计算,有些公司擅长网络。而新华三作为国内同时具备计算与网络核心能力的全栈ICT公司,如今正以一个层次分明、相互支撑的技术矩阵,化身为智算基础设施这一复杂系统的‘总成工程师’,通过深度的、系统级的协同,使网络成为算力的‘性能倍增器’,实现价值的乘数效应。”

新华三的“三支箭”

纵观新华三“算力×联接”的战略演进,会发现其恰似一名百步穿杨的神箭手,其技术纵深与产品迭代,每一步都精准命中产业痛点的靶心。

箭,从来不是孤立的武器,它必须同时满足“箭头锋利、箭杆坚韧、箭羽稳定”的三要素——这恰好对应新华三“算力×联接”战略里最凌厉、最互补的三支箭:

持续迭代的硬件矩阵——逼近工程与性能极限

此次新华三发布的102.4T芯片800G AI交换机,便是为了应对超大规模集群网络需求。该产品具备128个800G端口,为当前业内单机容量最高,可在两层Spine-Leaf架构下支持10K+800G端口。

遵循摩尔定律,更高的集成度意味着更低的功耗、更高的可靠性以及简化的运维复杂度。H3C S9828-128EP交换机从物理层面为智算中心的Scale-Out(横向扩展)扫清了障碍,将“网络高速公路”从双向四车道拓宽为双向十六车道,从根本上缓解了拥堵。

相比上一代产品,其能够节省70%的设备用量和50%的光模块用量。可以说,新华三是以逼近工程极限的技术能力,将摩尔定律翻译成了CFO也能听得懂的TCO曲线。

在算力层面,新华三7月刚刚发布了H3C UniPoD系列产品,代表了其在突破单卡计算性能边界上的极致努力,H3C UniPoD系列产品基于领先的Scale-up南向互联技术,实现了更高性能、更高密度、更高效率的三重进化,不仅实现单机柜64卡高密部署及互联互通,并同时具备向1024卡互联演进的能力。

这些基础设施的进化不仅大幅降低了AI应用的门槛,更推动了从集中式训练到分布式推理的全新计算范式转变。这一切,正是新华三“算力×联接”战略的进化注脚,其目标是让所有优秀的算力单元,都能在其构建的高性能网络上无缝协同,最终奏出和谐的交响乐。

DDC架构——智算网络的革命性重构

当InfiniBand凭借RDMA的传输优势,试图浇筑出AI训练集群的顶层“铁幕”时,新华三祭出了自己的“破甲箭”——DDC(Diversified Dynamic-Connectivity,多元动态联接)架构。这是新华三面对智算时代网络挑战给出的颠覆性答案。

InfiniBand的“铁甲优势”,形成于四维一体的生态锁死,但事物的另一面是,锁死也意味着僵化——当国产GPU、多元网卡、不同拓扑同时出现时,IB的适配就遇到了瓶颈。

DDC的革命性创新在于它彻底重构了传统网络架构。该架构采用信元交换机制,确保网络无拥塞和高效传输,彻底消除了流量失衡问题。通过采用字节级等长信元切片,保障了全链路流量均衡,能够有效应对All-to-All全线速流量冲击。此外,报文切片后能够消除对流量模式和数据包特征的敏感性,实现100%负载均衡,彻底解耦GPU、网卡。

经Tolly机构权威验证,DDC架构在有效带宽方面相比ECMP最高提升107%。在All-to-All场景下,传输大消息数据时的性能媲美InfiniBand方案。

端网协同智能管控——软硬件融合的智慧中枢

新华三的第三支利箭,是以软件定义和智能管控为核心的端网协同方案。这支箭的重要性在于它实现了算力与联接的智能协同,让硬件能力得到充分释放。

该方案通过增强CBRC算法,进一步提升了端网流量的有序协同能力。一方面,网络与网卡协同整合全局信息,实现统一调度与精细化流量均衡,显著提升训练效率、降低通信拥塞;另一方面,同时,算法引入更多网络参数,使测算更精准,在保障稳定性的同时最大化训练性能。

不难预见,基于多元算力生态,我国的智算发展必须走“算网融合”的特色路径,这既是环境要求,也是技术趋势。

这意味着未来的竞争,必将从“单点技术”的竞争,转向“系统级整合”能力的竞争。可以看到,新华三的“三支利箭”并非孤立存在,而是相互协同、相互增强的有机整体。这种协同效应正是系统论哲学下“算力×联接”战略精髓的体现。

(来源:钛媒体)



用户登录