DeepSeek开源第三弹:驱动V3/R1的代码库DeepGEMM 2025年02月26日,12时56分23秒 科技新知 阅读 38 views 次 2月26日消息,今日,OpenSourceWeek的第三天,DeepSeek公布了开源第三弹——DeepGEMM,一个支持密集型(Dense)和混合专家(MoE)GEMM操作的FP8库,用以驱动V3/R1模型的训练和推理。 据介绍,在Hopper GPU上,DeepGEMM可提供高达1350+ FP8 TFLOPS的计算能力。核心代码仅约300行,无复杂依赖,运行更加轻便高效。同时,支持密集型和两种MoE布局,广泛适用于各种神经网络计算需求。在安装时无需预编译,而是通过轻量级的即时编译(JIT)模块。(袁宁) 本文来自网易科技报道,更多资讯和深度内容,关注我们。 (来源:网易科技) 关联资讯: