当前位置: 首页 > news >正文

CANN/hixl CacheTask API 文档

CacheTask

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

说明:针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800I A2 推理服务器、A200I A2 Box 异构组件。

CacheTask构造函数

构造CacheTask,由CacheManager.transfer接口返回,表示分层传输异步任务。

synchronize

函数功能

等待所有层传输完成,并获取整体执行结果。

函数原型

synchronize(timeout_in_millis: Optional[int] = None) -> LLMStatusCode

参数说明

参数名称数据类型取值说明
timeout_in_millisOptional[int]等待超时时间,单位为毫秒,默认为None,表示不超时。

调用示例

ret = cache_task.synchronize()

返回值

正常情况下返回LLMStatusCode。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明

get_results

函数功能

等待所有层传输完成,并获取每个TransferConfig对应执行结果。

函数原型

get_results(timeout_in_millis: Optional[int] = None) -> List[LLMStatusCode]

参数说明

参数名称数据类型取值说明
timeout_in_millisOptional[int]等待超时时间,单位为毫秒,默认为None,表示不超时。

调用示例

rets = cache_task.get_results()

返回值

正常情况下返回LLMStatusCode的列表,对应每个TransferConfig的传输结果。

如果一个TransferConfig对应的layer还没有发起过传输,则对应的返回值为None。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/787297/

相关文章:

  • 056、步进电机加减速曲线:梯形曲线
  • 声明式工作流引擎:告别脚本混乱,实现CI/CD流程的代码化与模块化
  • TradeClaw:基于大语言模型与深度学习的量化交易AI工具集实战解析
  • 手机电源管理芯片技术演进与设计实践
  • Cursor编辑器MCP智能安装器:一键扩展AI助手能力,提升开发效率
  • ClawARR Suite:用Bash脚本与AI代理统一管理自托管媒体栈
  • 多智能体协同框架:从概念到实践,构建AI智能体集群的空中交通管制塔
  • ANTIDOTE项目:基于论证的可解释AI,为医疗AI决策提供“解毒剂”
  • ARM ITS寄存器架构与中断翻译机制详解
  • 智能家居技术架构与商业化路径解析
  • Awesome Vibe Coding:产品构建者的AI编程实战手册与技能树
  • KVQuant技术解析:量化KV Cache实现大模型百万级长上下文推理
  • 智能体编排实战:从单智能体到多智能体协同的架构设计与实现
  • Arm CoreSight调试架构原理与多核SoC应用
  • 基于MCP协议构建AI编程对话本地搜索引擎:cursor-history-mcp实战
  • KeymouseGo终极指南:三步解放双手,告别重复工作的鼠标键盘自动化神器
  • AI技术规划平台:Prompt工程与全栈架构实战解析
  • ARMv8虚拟化核心:HCRX_EL2寄存器详解与应用
  • 基于MCP协议构建AI工具服务器:从原理到实践
  • 基于MCP协议与FastMCP框架,构建连接AI助手与Testmo的智能测试管理桥梁
  • ARM中断处理与ISB指令同步机制详解
  • GitClaw:基于GitHub Actions的零成本AI代理系统架构解析
  • MAX1233/MAX1234触摸屏控制器架构与应用解析
  • 轻量级自动化工具LingxiFish:提升开发效率的任务执行器实践
  • n-VM架构解析:区块链多虚拟机统一执行方案
  • 软体连续机械臂的动态控制与性能突破
  • 中国技术出海的机遇与挑战:产品、合规与文化——软件测试视角的深度解析
  • 基于RAG的代码库智能问答系统:从原理到实战部署
  • lazyagent:统一监控多AI编程助手会话的本地开源工具
  • 终极显卡驱动清理指南:用Display Driver Uninstaller彻底解决驱动冲突问题