摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe
2025-02-28 10:19:30 小编:面条手游网
本站 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。
据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:
高效优化的 All-to-All 通信,支持 dispatch & combine
支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信
训练及推理预填充阶段的高吞吐量计算核心
推理解码阶段的低延迟计算核心
原生支持 FP8 数据分发
灵活控制 GPU 资源,实现计算与通信的高效重叠
DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。
目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。
本站附 Torch-MUSA 开源地址如下:
https://github.com/MooreThreads/Torch_MUSA
相关阅读:
《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》
《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》
《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》
《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》
- 猜你喜欢
-
胶卷相机9.9MB手游下载
-
剪映免费版无需会员9.9MB手游下载
-
spotube音乐9.9MB手游下载
-
全能影视app9.9MB手游下载
-
布蕾影城下载安装官网版9.9MB手游下载
-
腾讯视频去广告9.9MB手游下载
-
乐可广播剧在线收听免费听9.9MB手游下载
-
飞傲音乐app9.9MB手游下载
-
星空影视app免费版9.9MB手游下载
- 相关手机游戏
- 推荐手游玩法
- 摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe
- 《甜瘾》校园1V1结局究竟如何?
- 别打扰了,上课时间到了!这是否意味着需要更专注的课堂学习?
- 胡润打假“雷军当中国首富”并大秀中文:这两周他个人财富涨蛮多,可能前三名
- 为何在中文网络中难以找到优质的漫画资源?
- 女教师用夹我的方式重新教授汉字?这真的有效吗?
- 小米 15 Ultra 手机首发焕新极简相机,其他机型 5 月中旬起陆续推送
- “精品码产区一区二,这是怎样的神奇之处?”的疑问深入探索
- 蜜桃成语中的“时李时珍”之谜:如何重写中文汉字的独特魅力?
- 小米米家胶囊咖啡机 S1 开售:25 秒预热,国补到手价 398.65 元
- 最新手机精选
-
挺好专享2电视盒子版2025-01-12手游下载 | 9.9MB
-
妙剪软件下载2025-01-21手游下载 | 33.3M
-
tiktok2024最新版本下载2025-01-20手游下载 | 390.8M
-
醒图国际版2025-01-02手游下载 | 9.9MB
-
无他相机美颜免费下载最新版2025-01-24手游下载 | 9.9MB
-
OmoFun纯净版安卓2025-01-17手游下载 | 9.9MB