当前位置: 首页 > news >正文

CANN/hixl缓存接口文档

Cache

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

说明:针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800I A2 推理服务器、A200I A2 Box 异构组件。

Cache构造函数

构造Cache,该接口通常不需要用户调用,Cache对象由CacheManager里的allocate_cache、allocate_blocks_cache、register_cache或register_blocks_cache返回。

cache_id

函数功能

获取Cache的id。

函数原型

@property cache_id() -> int

参数说明

调用示例

... kv_cache = cache_manager.allocate_cache(cache_desc, cache_keys) print(kv_cache.cache_id)

返回值

正常情况返回类型为Cache的id。

约束说明

cache_desc

函数功能

获取Cache描述。

函数原型

@property cache_desc() -> CacheDesc

参数说明

调用示例

... kv_cache = cache_manager.allocate_cache(cache_desc, cache_keys) print(kv_cache.cache_desc.num_tensors)

返回值

正常情况返回类型为Cache的cache描述。

约束说明

tensor_addrs

函数功能

获取Cache的地址。

函数原型

@property tensor_addrs() -> List[int]

参数说明

调用示例

... kv_cache = cache_manager.allocate_cache(cache_desc, cache_keys) print(kv_cache.tensor_addrs)

返回值

正常情况返回类型为Cache的地址。

约束说明

create_cpu_cache

函数功能

创建cpu cache。

函数原型

create_cpu_cache(cache_desc: CacheDesc, addrs: List[int])

参数说明

参数名称数据类型取值说明
cache_descCacheDesccache的描述。
addrsList[int]cpu cache的地址。

调用示例

from llm_datadist import Cache cpu_cache = Cache.create_cpu_cache(cpu_cache_desc, cpu_addrs) # cpu_addrs来自创建的cpu tensors

返回值

正常情况返回类型为Cache的cpu_cache。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

传入参数为None,会抛出AttributeError异常。

约束说明

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/787076/

相关文章:

  • 2026年4月塑料原料回收公司口碑推荐,可靠的塑料原料回收品牌口碑推荐 - 品牌推荐师
  • 2026年评价高的旧房改造实力装修榜 - 品牌宣传支持者
  • 大模型架构拆解:从零件到整体,带你秒懂重复的精密艺术
  • CANNAMCT网络分解功能说明
  • 基于Next.js的ChatGPT Web应用开发:从架构设计到部署实战
  • 深度解析Claude Code CLI:基于LLM的智能命令行工具架构与实现
  • AI智能体驱动无代码开发:从自然语言指令到完整Web应用实战
  • 彻底清理Windows右键菜单:ContextMenuManager可视化管理指南
  • AI文本检测性能评估:从混淆矩阵到ROC曲线的实战解析
  • 2026年评价高的美的空调/美的中央空调专业公司推荐 - 行业平台推荐
  • 毕业设计 大数据校园卡数据分析系统(源码+论文)
  • CANN/sip复数矩阵批量乘法
  • slim-mcp:为AI Agent工具列表智能瘦身,节省70%上下文Token
  • 2026年北京市外资研发中心认定申报要点
  • 5分钟实战指南:掌握Xenos Windows DLL注入器的完整操作流程
  • Nodejs后端服务如何接入Taotoken多模型API接口
  • 河北沧州企业认定市级、省级、国家级企业技术中心有多少奖补?
  • 如何在本地 Docker 环境中部署 DeepSeek API 转发网关服务
  • 基于Kubernetes Operator的大模型推理服务云原生部署实践
  • CANN/opbase SmallVector接口
  • 2025年东莞高职院校深度解析:广东酒店管理职业技术学院凭什么成为本地学子首选? - 品牌策略师
  • 2026年4月市面上诚信的复叶槭批发基地种植推荐,紫薇/红叶李/金森女贞/丝棉木/苗木/红叶石楠,复叶槭批发基地种植推荐 - 品牌推荐师
  • 申请高新技术企业需要几个专利?有要求吗?
  • 终极输入法词库转换指南:3分钟搞定20+输入法格式迁移
  • Python如何下载文件:从基础到进阶的完整指南
  • Godot 4双网格瓦片地图系统:解耦逻辑与渲染的进阶实践
  • APC:统一管理AI编程工具配置,告别配置孤岛与同步困境
  • Video DownloadHelper CoApp终极指南:从零开始高效下载与转换视频
  • DeepSeek-TUI:终端里的 AI 编码 Agent
  • Lumberjack Theme:基于TypeScript引擎的精准VS Code主题设计与工程实践