当前位置: 首页 > news >正文

CANN/cann-learning-hub:HIXL在RL推理中的长尾时延优化

HIXL在RL推理中的长尾时延优化

【免费下载链接】cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。项目地址: https://gitcode.com/cann/cann-learning-hub

昇腾CANN的全面开源开放,正为开发者构建起更开放、更灵活的AI原生开发生态。作为昇腾CANN核心组件之一的单边通信库HIXL,现已正式加入开源阵营,凭借其解耦化设计与高效传输能力,让开发者能够自主快速构建大模型PD分离、RL后训练参数切换、模型参数缓存等多样化业务场景,为AI技术在实际业务中的应用提供底层支持。

HIXL在RL推理场景中的实践:实现自研PD分离方案与集群效率提升

在AI技术深度落地的当下,强化学习RL作为关键技术方向,正被越来越多企业应用于实际业务中。某客户在自研的强化学习任务中,将业务流程明确划分为训练与推理两部分。在推理阶段,遇到了典型的长尾问题------这种负载不均衡不仅导致推理效率降低,更造成了千卡集群中部分算力的浪费。

为解决这一问题,该客户基于昇腾CANN开源生态,构建了一套贴合自身需求的解决方案:通过自研推理框架对接Mooncake,再结合HIXL完成数据传输,实现推理阶段的自研PD分离方案部署。在这一架构中,HIXL负责KV Cache池化后的底层数据传输。HIXL在单边通信场景中的高效性能,保障了KV Cache数据在分布式节点间的快速流转,从而缓解长尾问题带来的算力浪费,提升千卡集群资源利用率,优化了RL推理环节的执行效率。

  • Mooncake Store(主流分布式KV缓存存储引擎):将可复用的KV缓存存储在推理集群的不同位置,提供KV缓存管理能力。
  • Mooncake Transfer Engine(高性能数据传输引擎):兼容多种通信后端,通过Ascend Direct Transport对接HIXL。
  • HIXL(昇腾开源单边通信组件):提供高性能、零拷贝的点对点数据传输能力,提供PD分离场景KV缓存在Prefill节点和Decode节点间相互传输的底层能力。
开源开放核心价值:从依赖发布到自主迭代

在昇腾CANN未开源之前,开发者在使用相关组件时,一旦遇到新的业务需求或使用中的问题,只能等待新版本发布,而这个周期通常比较长,可能影响项目进度。HIXL全面开源后,这一局面得到改变:

  • 问题修复闭环效率提升:开发者可通过开源社区快速定位并修复问题,无需长期等待官方更新;
  • 定制化开发更灵活:针对特定业务场景,开发者能够基于开源代码自主优化,加速功能落地;
  • 社区共建逐渐形成:开发者可以将业务实践中积累的优化方案贡献至开源社区,推动组件功能更贴近真实应用需求。
持续开源:与开发者共同构建更实用的AI基础软件生态

HIXL的开源开放反映了昇腾CANN在推进底层软件开放上的持续投入。开放代码不仅降低了使用门槛,也让开发者能更深入地参与到工具链的优化中。未来,CANN将继续推进核心组件的开源,通过HIXL这类高可适配的组件,为开发者提供自主构建和优化的基础,共同推进AI技术在实际业务中的高效落地。

更多学习资源

HIXL社区: https://link.gitcode.com/i/c185b6cf4f4b1f47e3a87174b5721231

HIXL 适配Mooncake对接示例:

https://link.gitcode.com/i/c185b6cf4f4b1f47e3a87174b5721231/blob/master/examples/third_parties/mooncake_store/python/README.md

Mooncake社区:

https://github.com/kvcache-ai/mooncake

【免费下载链接】cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。项目地址: https://gitcode.com/cann/cann-learning-hub

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/783262/

相关文章:

  • CANN/hccl集合通信AlltoAllVC
  • 终极APA第7版格式转换指南:3分钟解决学术论文引用难题
  • 阿里云邮箱华东区域服务商有哪些?2026靠谱服务商推荐 - 品牌2025
  • 2026年成都水刀配件采购指南:从易损件困局到一站式解决方案 - 企业名录优选推荐
  • 2026年成都水刀配件厂家深度评测:力好机械与KMT/大地/永达品牌对比指南 - 企业名录优选推荐
  • 从零掌握DriverStore Explorer:Windows驱动管理的终极解决方案
  • 2026年必备:3招根治导师最怕的带AI痕迹论文,附一键去AI痕迹工具 - 降AI实验室
  • 支持本地部署的openclaw国产平替:企业级龙虾智能体全解析 - 品牌2025
  • 为OpenClaw配置Taotoken作为后端大模型供应商的详细步骤
  • RAG-Agent架构在肿瘤治疗决策支持系统中的实践与应用
  • 2026年4月评价好的NTM(NICHIFU端子公司推荐分析,NICHIFU端子:耐腐蚀设计,持久耐用 - 品牌推荐师
  • XAI赋能老年健康界面:从黑盒决策到可解释交互的设计实践
  • 广州亿源贸易商行:增城名酒回收公司电话 - LYL仔仔
  • BlueKeep翻车实录:说好的远程代码执行,怎么只换来一个蓝屏?
  • CANN/ops-transformer块稀疏注意力梯度算子
  • 2026年北京高空作业设备租赁排行榜:全品类服务商优选(升降机、高空车、曲臂车、直臂车、蜘蛛车、云梯车、叉车租赁(出租)) - damaigeo
  • 京津冀无甲醛家具品牌26年5月实测:4家头部品牌核心指标对比 - 奔跑123
  • 漏洞扫描、渗透测试、代码审计怎么选?安卓安全检测技术路线深度对比
  • 2026年成都水刀配件行业深度横评与采购指南 - 企业名录优选推荐
  • 哔哩下载姬DownKyi:从新手到高手的B站视频下载完全指南
  • CANGARU指南:生成式AI在学术研究中的负责任使用框架与实践
  • 智慧楼宇能效与运维难?映翰通 EC312 LoRaWAN 网关实战方案
  • 上海阿里云企业邮箱找哪些公司?靠谱服务商及联系电话详解 - 品牌2025
  • 江西省青蜂环保:奉新有害生物防治推荐几家 - LYL仔仔
  • 国内总镉水质在线分析仪十大品牌排名 - 仪表人小余
  • 推荐几家超声波液位开关生产厂家,国产超声波液位开关哪家好? - 品牌推荐大师1
  • CANN HCOMM流式线程获取
  • 大模型Function Call
  • 2026年5月深圳GEO优化公司推荐|本土服务商全维度测评榜单 - 品牌洞察官
  • 智能极速抢票:用Python脚本3分钟破解大麦网购票难题