DeepSeek致谢腾讯技术团队,DeepEP开源通信框架性能显著提升

2025年05月07日,21时18分56秒 科技新知 阅读 13 views 次

IT之家5月7日消息,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在 RoCE网络环境提升100%,IB 网络环境提升 30%,为企业开展AI大模型训练提供更高效的解决方案。

该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

IT之家注:DeepEP是一个为专家混合(MoE)和专家并行(EP)量身定制的通信库。它提供高吞吐量和低延迟的全对全GPU内核,这些内核也被称为MoE派发和组合。该库还支持低精度运算,包括FP8。

据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

在腾讯的技术优化下,DeepEP不仅在RoCE 网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的环境中,这套方案展现出出色的通用性。

(来源:新浪科技)

标签:


用户登录