当前位置: 首页 > news >正文

CANN/ge LLM-DataDist Python接口

# LLM-DataDist接口参考(Python)

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

  • LLM-DataDist-interface-list

  • LLMDataDist

    • LLMDataDist-constructor
    • init
    • finalize
    • link_clusters
    • unlink_clusters
    • check_link_status
    • kv_cache_manager
    • switch_role
  • LLMConfig

    • LLMConfig-constructor
    • generate_options
    • device_id
    • sync_kv_timeout
    • enable_switch_role
    • ge_options
    • listen_ip_info
    • mem_utilization
    • buf_pool_cfg
  • KvCacheManager

    • KvCacheManager-constructor
    • is_initialized
    • allocate_cache
    • deallocate_cache
    • remove_cache_key
    • pull_cache
    • copy_cache
    • get_cache_tensors
    • allocate_blocks_cache
    • pull_blocks
    • copy_blocks
    • swap_blocks
    • transfer_cache_async
  • KvCache

    • KvCache-constructor
    • cache_id
    • cache_desc
    • per_device_tensor_addrs
    • create_cpu_cache
  • LLMRole

  • LLMClusterInfo

    • LLMClusterInfo-constructor
    • remote_cluster_id
    • append_local_ip_info
    • append_remote_ip_info
  • Placement

  • CacheDesc

  • CacheKey

  • CacheKeyByIdAndIndex

  • BlocksCacheKey

  • LayerSynchronizer

  • TransferConfig

  • TransferWithCacheKeyConfig

  • CacheTask

    • CacheTask-constructor
    • synchronize
    • get_results
  • LLMException

  • LLMStatusCode

  • DataType

  • deprecated

    • TensorDesc

      • TensorDesc-constructor
      • dtype
      • shape
    • Tensor

      • Tensor-constructor
      • numpy

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1124156/

相关文章:

  • 如何在FPDF中自定义页眉页脚:打造专业PDF报告
  • 从0到1开发OpenCPU Web应用:基于R语言的交互式科研工具
  • HuggingFaceModelDownloader社区贡献指南:如何参与项目开发
  • 如何通过统一AI网关架构解决多模型集成难题:new-api开源项目的完整实践指南
  • Flutter_thrio模块化开发实践:如何优雅组织大型混合应用代码
  • OpenCPU核心功能解析:HTTP API如何赋能R语言远程计算
  • Unity3DRuntimeTransformGizmo的未来发展:路线图与社区贡献指南
  • FluidNet边界条件处理:复杂几何体流体交互的技术挑战
  • 电流频率转换模块选型要考虑哪些参数?量程匹配、精度等级与封装形式的综合决策
  • 归藏提示词库复古滤镜应用:诺基亚手机照片滤镜的现代创意用法终极指南
  • 如何用WeChatMsg永久保存微信聊天记录:终极免费解决方案
  • GL-iNet路由器iStoreOS风格化方案:免刷机一键美化实现
  • autopprof社区贡献指南:如何参与开源项目开发
  • Reacord状态管理最佳实践:构建响应式Discord交互界面
  • 三步让模糊视频变高清:Video2X AI视频增强全攻略
  • ofa.js 插槽系统:灵活的内容分发机制完全指南
  • 内容编辑工作流:Instatic效率提升与协作技巧
  • ngxtension DOM 交互指南:点击外部、手势、滚动监听等实用工具详解
  • 如何高效使用UserAgent-Switcher浏览器扩展:完整实战指南
  • hashdeep与其他哈希工具对比:Encase、NSRL、iLook格式支持详解
  • GFile性能优化:多连接并行传输与带宽测试基准指南
  • LiveViewJS vs 传统SPA:为什么服务器端渲染实时应用是未来趋势
  • 如何使用new-component提升React项目开发效率300%
  • 汽车制造新风口!2026武汉汽车塑料及复合材料展会揭秘未来材料黑科技
  • 一边重构,一边要完成日常任务……
  • 漫画下载神器:E-Hentai高效工具使用指南 [特殊字符]
  • OpenRadioss在汽车碰撞仿真中的应用:从模型建立到结果验证的完整流程
  • DVWA文件上传漏洞实战:从Low到High级别攻防与防御策略
  • CANN/GE FuncProcessPoint API 文档
  • GFile高级应用场景:大规模文件分发与跨平台传输实战