当前位置: 首页 > news >正文

PP pipeline并行算法总结

ZBV思路有点类似1F1B-Interleaved, 上图说的chunk0是按模型切的不同的virtual pipeline stage(如layer0), chunk1是layer5. 所以pp通信量会增加vps倍。

1F1B-Interleaved 和virtual pipeline stage的原理:

DualPipe

上面蓝色框对应下的面这一部分。

DualPipeV

对比维度DualPipeDualPipeV关键解读
核心调度模式双向对称:数据从两端同时流入,设备两两镜像。V形调度:数据单向流入,在末端折返,形成一个“V”形路径。DualPipeV用更巧妙的单行道实现了双向流的效率。
参数内存2倍(2×)1倍(1×)这是DualPipeV最核心的优势!它直接消除了参数冗余,解决了之前讨论的显存翻倍问题。
所需设备数PPPP/2在达到相同流水线深度(PP)时,DualPipeV只需要一半的设备。
流水线气泡(PP/2-1)(F&B+B-3W)(PP/2-1)(F&B+B-3W)性能无妥协,两者的气泡大小公式完全相同,保持了极高的并行效率。
激活内存PP+1PP+1两者激活内存占用基本相同。
流水线通信量1倍 (1×)2倍 (2×)这是DualPipeV为了消除参数冗余而付出的新代价:设备间的通信量翻倍。
http://www.jsqmd.com/news/827071/

相关文章:

  • 7B 模型拿到 97.5% 成功率:Agent 终于学会自己选技能、用技能、造新技能了!
  • WebPlotDigitizer完整指南:3步从图表图像中提取数据
  • 罗技鼠标宏终极教程:3步实现PUBG完美压枪控制
  • 魔兽争霸3兼容性修复终极指南:5步解决现代系统闪退问题
  • 基于规则引擎的自动化文件管理工具smartcat实战指南
  • 基于TypeScript的MCP服务器开发指南:为AI助手构建安全工具调用能力
  • 从Gossip协议到协同共识:构建去中心化蜂群系统的核心架构与实战挑战
  • Cursor AI 编程助手项目专属规则配置指南:从通用到定制
  • 欧拉OpenEuler基于Kubeasz部署k8s
  • 二次元游戏模组管理革命:XXMI启动器一站式解决方案完全指南
  • OpenAPI规范代码辅助功能为API全生命周期开发提供智能化支持,覆盖API设计、开发、测试、文档、部署等各个阶段
  • 雷达系统原理与脉冲测量技术详解
  • 告别环境噩梦:用Docker一键部署OpenMVG和OpenMVS开发环境(支持GPU加速)
  • Redis怎样配置不同环境下的内存淘汰机制
  • Windows11系统 26H1 X-Lite V3 精简纯净版 安装全流程
  • RK3506开发板PWM输入捕获配置与调试实战指南
  • AI Agent安全防护中间件agentguard:构建LLM应用的安全执行层
  • 独立开发者如何利用Taotoken实现按token精细计费控制个人项目AI成本
  • 魔兽争霸3终极增强指南:WarcraftHelper完全使用教程
  • 终极虚拟显示器方案:让Windows电脑秒变多屏工作站
  • NotebookLM智能体插件:AI驱动的自动化知识处理与任务执行
  • Go语言工厂模式:对象创建封装
  • Lealone数据库内核解析:一体化架构与向量化引擎的工程实践
  • XNBCLI:3分钟学会星露谷物语XNB文件修改的终极指南
  • 普通人如何构建AI智能体?一篇文章搞定——快速搭建属于自己的智能体
  • AI技能工程框架解析:从模块化设计到智能体构建实战
  • Java多态从入门到通关:考点精讲+面试考点+项目实战
  • 基于AI-Dial-Core构建企业级对话AI核心:从工具抽象到安全实践
  • 现代SaaS应用全栈开发:从Next.js、Prisma到Stripe的实战样板间解析
  • 定制你的专属探针:PEG-锰基纳米材料,为精准科研而生