当前位置: 首页 > news >正文

CANN/hixl LLM-DataDist数据结构

LLM-DataDist数据结构

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

LlmRole

LLM-DataDist的角色

enum class LlmRole : int32_t { kPrompt = 1, // 角色为Prompt kDecoder = 2, // 角色为Decoder kMix = 3, // 角色为Mix kEnd // 无效值 }

CachePlacement

Cache的内存类型

enum class CachePlacement : uint32_t { kHost = 0U, // Cache为Host内存 kDevice = 1U, // Cache为Device内存 }

CacheDesc

Cache的描述信息

struct CacheDesc { CachePlacement placement = CachePlacement::kDevice; // 内存类型 uint32_t num_tensors = 0U; // Cache包含的tensor个数 DataType data_type = DT_UNDEFINED; // Cache中tensor的数据类型 std::vector<int64_t> shape; // Cache中tensor的shape uint8_t reserved[128]; // 预留 }

CacheIndex

Cache的索引

struct CacheIndex { uint64_t cluster_id; // cache所在的集群ID int64_t cache_id; // cache的ID uint32_t batch_index; // PullKvCache时用于指定batch的下标 uint8_t reserved[128]; // 预留 }

Cache

Cache,其中维护了一组tensor的地址

struct Cache { int64_t cache_id = -1; // Cache的ID std::vector<uintptr_t> tensor_addrs; // Cache中各tensor的地址, 在单进程多卡场景中,多卡的地址依次排列。 CacheDesc cache_desc; // Cache描述 uint8_t reserved[128]; // 预留 }

ClusterInfo和IpInfo

用于描述集群信息,用于建链与断链。

struct ClusterInfo { uint64_t remote_cluster_id = 0U; // 对端的LLM-DataDist的cluster_id int32_t remote_role_type = 0; // 对端的LLM-DataDist的role_type,0表示全量,1表示增量 std::vector<IpInfo> local_ip_infos; // 本地LLM-DataDist的IP信息,详见如下结构体IpInfo std::vector<IpInfo> remote_ip_infos; // 对端LLM-DataDist的IP信息,详见如下结构体IpInfo uint8_t reserved[128]; // 预留 } struct IpInfo { AscendString ip; // IP地址 uint16_t port = 0U; // 端口号 uint8_t reserved[128]; // 预留 }

KvCacheExtParam

调用Pull或Push相关接口时传入的扩展参数。

struct KvCacheExtParam { std::pair<int32_t, int32_t> src_layer_range = {-1, -1}; // KV传输时源端的层数范围 std::pair<int32_t, int32_t> dst_layer_range{-1, -1}; // KV传输时目的端的层数范围 uint8_t tensor_num_per_layer = 2U; // KV传输时一层的tensor数量 uint8_t reserved[127]; // 预留字段 }

RegisterCfg

调用RegisterKvCache接口时传入的配置参数。

struct RegisterCfg { uint8_t reserved[128] = {0}; // 预留字段 }

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/782939/

相关文章:

  • 6G时代零接触式普适AI即服务架构:融合区块链与DRL的自动化AI交付
  • cann/runtime其他接口API文档
  • 顶会论文模块复现与二次创新:二次创新:将 DETR 的查询式检测头蒸馏进 YOLOv11,打造混合式 Anchor-free 头
  • 模型诊断:从冲突集到命中集,构建高效故障定位系统
  • CANN/catlass Gemm/Block类模板概述
  • DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM
  • 如何高效实现魔兽争霸3现代化兼容?WarcraftHelper实战指南
  • CANN/driver容器共享配置查询
  • CANN/cannbot-skills 模型审查专家代理
  • GD32中的DMA使用教程
  • HCOMM通信算子NPU环境测试
  • Kemptide (Phosphate Acceptor Peptide);LRRASLG
  • 【算法】小白也能懂 · 第 2 节:数组双指针技巧(快慢指针、左右指针)
  • CANN/atvoss向量算子库概述
  • 别再盲目自学 CTF!零基础专属入门完整路线,看完直接上手实战
  • 面向对象设计原则在Java开发中的应用
  • CANN/metadef GetAddr函数API文档
  • 可解释AI在膝骨关节炎诊断中的应用:从黑盒模型到临床可信赖的决策伙伴
  • 医疗生成式AI的伦理治理:GREAT PLEA框架下的公平、可靠与问责实践
  • CANN/tensorflow AOE调优配置
  • CANN/asc-devkit AllocTensor API
  • 遥感图像分类可解释AI方法:定量评估与工程实践指南
  • 显卡驱动冲突终极解决方案:Display Driver Uninstaller深度使用指南
  • 第8天:常用数据结构之列表
  • AI安全新范式:从红蓝对抗到紫队协同的实战指南
  • 3个核心功能让你轻松掌握QtScrcpy:免费开源的Android投屏控制终极指南
  • 毕业论文查重网站终极横评:知网/维普/PaperPass/PaperYY谁最准?
  • CANN/pypto RMS归一化API文档
  • 马斯克投1200亿建芯片工厂,微美全息加速量子算力集群进入全球“AI军备竞赛”
  • CANN/hcomm组调用结束接口