DeepSeek开源周第四天：优化的并行策略

AIGC新知

发布于 2025-02-28 12:34:45

1320

文章被收录于专栏：AIGC新知AIGC新知

Deepseek开源周第三弹：DeepSeek-V3和R1 模型背后的并行计算优化技术。

DualPipe：一种双向流水线并行算法，能够完全重叠前向和后向计算-通信阶段，并减少“流水线气泡”。
Expert Parallelism Load Balancer (EPLB)：用于MoE的负载均衡算法，智能地分配专家到不同GPU上，确保计算资源的均衡利用，让每个GPU雨露均沾。
Profiling Data：展示训练和推理框架的性能分析数据。

DualPipe：双向流水线并行算法

项目地址：https://github.com/deepseek-ai/DualPipe

DualPipe 是 DeepSeek-V3 技术报告中介绍的一种创新的双向管道平行算法。它实现了前向和后向计算通信阶段的完全重叠，还减少了管道气泡。

管道气泡和内存使用情况比较

其中，F 表示正向数据块的执行时间，B 表示完整向后数据块的执行时间，W 表示“向后权重”数据块的执行时间，F&B 表示两个相互重叠的正向和向后数据块的执行时间。

方法	气泡（Bubble）	参数内存	激活内存
1F1B	(PP-1)(𝐹+𝐵)	1×	PP
ZB1P	(PP-1)(𝐹+𝐵-2𝑊)	1×	PP
DualPipe	(PP/2-1)(𝐹&𝐵+𝐵-3𝑊)	2×	PP+1

EPLB：专家并行负载均衡，让 GPU 雨露均沾

项目地址：https://github.com/deepseek-ai/eplb

采用冗余专家策略，复制重负荷专家。然后，我们将重复的专家试探式打包到 GPU 中，以确保不同 GPU 之间的负载平衡。

EPLB 提供了两种负载均衡策略：

Hierarchical Load Balancing (分层负载均衡)：当服务器节点数可以整除专家组数时使用，先平衡节点间的负载，再平衡节点内 GPU 的负载，适用于预填充 (prefilling) 阶段
Global Load Balancing (全局负载均衡)：适用于其他情况。全局复制专家，然后分配到各个 GPU，适用于解码 (decoding) 阶段

profile-data：性能分析数据，揭秘 V3/R1 并行策略！

项目地址：https://github.com/deepseek-ai/profile-data