当前位置: 首页 > news >正文

CANN/shmem RDMA性能测试示例

环境要求

【免费下载链接】shmemCANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。项目地址: https://gitcode.com/cann/shmem

同rdma_demo中的环境要求。

使用方式

1.在shmem/目录编译:

bash scripts/build.sh -enable_rdma -examples

2.在shmem/目录运行:

export PROJECT_ROOT=<shmem-root-directory> export LD_LIBRARY_PATH=${PROJECT_ROOT}/build/lib:$LD_LIBRARY_PATH export SHMEM_UID_SESSION_ID=127.0.0.1:8899 ./build/bin/rdma_perftest 2 0 tcp://127.0.0.1:8899 2 0 0 highlevel_put_pingpong_latency 64 # pe 0 ./build/bin/rdma_perftest 2 1 tcp://127.0.0.1:8899 2 1 1 highlevel_put_pingpong_latency 64 # pe 1

3.命令行参数说明 ./rdma_perftest <n_pes> <pe_id> <g_npus> <f_pe> <f_npu> <test_type> <msg_len>

  • n_pes: 全局pe数量,只支持2个pe。
  • pe_id: 当前进程的pe号。
  • ipport: SHMEM初始化需要的IP及端口号,格式为tcp:// :<端口号>。如果执行跨机测试,需要将IP设为pe0所在Host的IP。
  • g_npus: 当前卡上启动的NPU数量。
  • f_pe: 当前卡上使用的第一个pe号。
  • f_npu: 当前卡上使用的第一个NPU卡号。
  • test_type: 测试类型。
    • highlevel_put_pingpong_latency:测试Put高阶接口的pingpong时延。
    • postsend_cost: 测试postsend接口耗时。
    • highlevel_put_bw: 测试Put高阶接口的带宽。
    • rdma_mte_bw: 测试并行下发MTE和RDMA时的带宽。
  • msg_len: 测试传输的数据量大小,单位为字节(Byte)。

【免费下载链接】shmemCANN SHMEM 是面向昇腾平台的多机多卡内存通信库,基于OpenSHMEM 标准协议,实现跨设备的高效内存访问与数据同步。项目地址: https://gitcode.com/cann/shmem

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/785294/

相关文章:

  • FWT 集合幂级数
  • 基于可穿戴设备与AI的体重变化预测:从血糖、活动、睡眠数据到个性化健康管理
  • 力扣2760 C++滑动窗口解法
  • 移动干扰源定位系统:原理、配置与实战技巧
  • Ubuntu 20.04换源踩坑实录:手把手教你修复‘held broken packages’报错(附清华源正确姿势)
  • RSSHub与Dify插件实战:构建智能信息流与自动化监控工作流
  • 用最便宜的STM32F103C8T6做个自平衡小车?先搞定MPU6050+DMP姿态角(附完整代码)
  • 龙芯2k0300 - 走马观碑组按键驱动移植
  • AI公平性实战指南:从算法偏见来源到缓解策略全解析
  • 市场报告对比:液冷清洁度检测设备怎么选?西恩士提全套解决方案 - 工业干货社
  • 别再手动清C盘了!分享一个我用了3年的Windows10垃圾清理.bat脚本(附详细注释)
  • UX设计师如何驾驭生成式AI:从工具使用者到AI策展人的实践指南
  • cann/sip:信号处理加速库CgemvBatchedOperation C++ Demo
  • taotoken平台openai兼容api的python调用基础教程
  • 《落海的人》的内容入口:低潮情绪如何被记住
  • Claude API用量监控桌面小组件开发实战:Python+SwiftBar实现成本可视化
  • 告别VSCode!在Ubuntu 22.04上用Vim+YouCompleteMe打造丝滑C++开发环境(保姆级避坑指南)
  • 42 Nginx的server_name匹配执行顺序
  • 从红蓝对抗到紫队协同:构建负责任AI安全治理新范式
  • GMod服务器开发:基于ClawCompany框架的模块化架构与工程实践
  • AI公平性实战:从偏见检测到模型优化的全流程指南
  • AI在癌症病理切片分析中的五大核心任务与临床转化挑战
  • ChatGPT在高等教育考核中的表现与影响:实证研究与应对策略
  • CANN/shmem SDMA使用说明
  • CANN/pyasc核间同步接口文档
  • 开源3D模型实战:从GitHub资源到Unity/Blender高效应用与优化
  • pywencai:从自然语言到金融数据的智能桥梁
  • CANN/ops-nn贡献指南
  • Web 3.0技术融合:区块链、AI与边缘计算的协同架构与实践
  • 2026年降AI工具万方实测对比:主流五款工具万方AIGC检测通过率与价格完整分析