当前位置: 首页 > news >正文

CANN/ge LLM-DataDist Python接口参考

# LLM-DataDist接口参考(Python)

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

  • LLM-DataDist-interface-list

  • LLMDataDist

    • LLMDataDist-constructor
    • init
    • finalize
    • link_clusters
    • unlink_clusters
    • check_link_status
    • kv_cache_manager
    • switch_role
  • LLMConfig

    • LLMConfig-constructor
    • generate_options
    • device_id
    • sync_kv_timeout
    • enable_switch_role
    • ge_options
    • listen_ip_info
    • mem_utilization
    • buf_pool_cfg
  • KvCacheManager

    • KvCacheManager-constructor
    • is_initialized
    • allocate_cache
    • deallocate_cache
    • remove_cache_key
    • pull_cache
    • copy_cache
    • get_cache_tensors
    • allocate_blocks_cache
    • pull_blocks
    • copy_blocks
    • swap_blocks
    • transfer_cache_async
  • KvCache

    • KvCache-constructor
    • cache_id
    • cache_desc
    • per_device_tensor_addrs
    • create_cpu_cache
  • LLMRole

  • LLMClusterInfo

    • LLMClusterInfo-constructor
    • remote_cluster_id
    • append_local_ip_info
    • append_remote_ip_info
  • Placement

  • CacheDesc

  • CacheKey

  • CacheKeyByIdAndIndex

  • BlocksCacheKey

  • LayerSynchronizer

  • TransferConfig

  • TransferWithCacheKeyConfig

  • CacheTask

    • CacheTask-constructor
    • synchronize
    • get_results
  • LLMException

  • LLMStatusCode

  • DataType

  • deprecated

    • TensorDesc

      • TensorDesc-constructor
      • dtype
      • shape
    • Tensor

      • Tensor-constructor
      • numpy

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1071235/

相关文章:

  • 如何贡献Awesome Neural Models for Semantic Match:社区参与指南与最佳实践
  • CANN/catlass MXFP4矩阵乘法示例
  • 随机游走:从醉汉模型到PageRank,揭秘随机性中的确定性规律
  • 深入解析MPC885 PowerQUICC:通信处理器的架构、外设与开发实战
  • 通讯协议(串口通信,SPI通信,I2C通信,CAN通信)
  • 列编辑革命:Notepad--如何用垂直思维重塑文本处理效率
  • Bouncy Castle Java性能优化与安全最佳实践:10个关键技巧
  • YOLOv11多光谱目标检测深度解析:3大核心技术挑战与实战解决方案
  • UDS-C与ISO 14229:一文读懂汽车统一诊断服务的实现原理 [特殊字符][特殊字符]
  • NCM加密音频格式解析与转换:从原理到批量处理实战
  • 27种反弹Shell实战指南:从原理到应用场景全面解析
  • 如何利用hongyangWeixinArticles构建企业级Android培训体系
  • DSPy流式处理终极指南:实时响应与状态管理实战教程
  • 从NASA 2001年技术遗产看实时系统、复合材料与深空通信的工程实践
  • 网课学习助手:让在线课程学习更高效的自动化工具
  • 告别浏览器标签混乱:SimplexityAI桌面应用如何让你的AI搜索效率提升300%[特殊字符]
  • 量化模型部署工具llama.cpp
  • 网页界面:简洁的表
  • FreeOpcUa与MQTT集成:构建工业物联网数据网关的终极指南
  • 终极指南:如何用DSPy构建智能金融服务AI系统
  • Crayon完全指南:如何用任何语言轻松接入TensorBoard的强大可视化能力
  • Python的杂项
  • Cocos Creator开发学习路线(个人向)
  • Ultralytics YOLO终极指南:从零到一的计算机视觉革命
  • 从创意到实现:基于ESP32与WS2812B打造光影涟漪智能时钟
  • BabelDOC:让PDF文档实现智能双语翻译的5步魔法
  • 如何用PyTorch实现Deep Learning Illustrated中的深度学习模型
  • MATLAB音频修复实战:从降噪到均衡,重现历史录音的经典之声
  • CANN/catlass模板库优化指南
  • Python虚拟显示神器PyVirtualDisplay:终极无头GUI测试解决方案