当前位置: 首页 > news >正文

CANN torchtitan-npu 安装指南

软件安装

【免费下载链接】torchtitan-npuAscend Extension for torchtitan项目地址: https://gitcode.com/cann/torchtitan-npu

版本配套表

torchtitan-npu支持Atlas 800T A3等昇腾训练硬件形态。软件版本配套表如下:

torchtitan-npu版本torchtitan版本PyTorch版本torch_npu版本CANN版本Python版本Triton Ascend
master(主线)0.2.22.10.02.10.0rc29.0.0-beta.1Python3.11.x3.2.0

源码安装

1.安装依赖的软件

在安装torchtitan-npu之前,请参考版本配套表,安装配套的昇腾软件栈,软件列表如下:

依赖软件软件安装指南
昇腾NPU驱动《驱动固件安装指南》
昇腾NPU固件
Toolkit(开发套件)《CANN 软件安装指南》
Kernel(算子包)
NNAL(Ascend Transformer Boost加速库)
PyTorch《Ascend Extension for PyTorch 配置与安装》
torch_npu插件

2. 下载torchtitan-npu源码master分支(请注意下列命令的大小写)

git clone https://gitcode.com/cann/torchtitan-npu.git

3. 安装torchtitan-npu

cd torchtitan-npu pip install -r requirements.txt pip install -e .

注:如有旧版本Torchtitan-npu,请先卸载,再进行安装

4. 安装inductor-npu-ext(可选,使能torch.compile时需要)

为了在 NPU 平台上充分利用torch.compile原生的编译能力,torchtitan_npu在保留 Dynamo 与 Inductor 既有编译流程的基础上,接入了 Codegen 后端inductor-npu-ext。该后端借助 AutoFuse 的自动融合能力,从 Inductor IR 生成 AscendC 融合 Kernel。

inductor_npu_ext 需要从源码安装。在运行环境内执行以下命令:

git clone https://gitcode.com/Ascend/torchair.git cd torchair/experimental/_inductor_npu_ext/ pip3 install -e ./python/ cd -

注:具体torch.compile特性文档请参考 说明文档

PyPI安装

pip install torchtitan_npu==0.2.2.post1

卸载

pip uninstall torchtitan_npu

【免费下载链接】torchtitan-npuAscend Extension for torchtitan项目地址: https://gitcode.com/cann/torchtitan-npu

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/784146/

相关文章:

  • 西安不干胶标签定制与企业画册设计印刷一站式解决方案|2026年源头工厂选购指南 - 企业名录优选推荐
  • 2026年4月优选!屠宰场车辆洗消中心服务商大盘点,屠宰场车辆洗消中心/生猪运输车辆洗消设备,洗消中心安装维护商哪家可靠 - 品牌推荐师
  • 全球南方国家AI治理:发展权、数字主权与多元文化视角下的路径探索
  • 大型语言模型推理新框架:State over Tokens解析
  • 从游戏修改到逆向思维:用Cheat Engine Tutorial 8关实战,理解内存与汇编
  • 轨迹识别与空间记忆分析技术原理与应用
  • CANN ATVC Addcmul算子样例
  • CANN / ops-rand:算子调用
  • 数字孪生大脑:构建、挑战与脑疾病干预新范式
  • 2026年西安活页环装定制与企业印刷品一站式解决方案完全指南 - 企业名录优选推荐
  • 基于MCP协议的Testmo-AI集成:测试管理智能化实践指南
  • 2026年昆明短视频运营与AI全网推广:本地化精准投流完全方案 - 年度推荐企业名录
  • CANN/ops-nn Sigmoid算子接口
  • 空间记忆模型在视频分析中的应用与优化
  • 大语言模型在教育领域的应用、风险与政策应对
  • 告别迷茫:一文读懂STM32MP135的TF-A、OP-TEE与U-Boot在EMMC中的布局奥秘
  • 生成式AI如何重塑劳动力市场:从技能变迁到教育适应
  • 2026靠谱商用音乐版权平台排行榜 诚信版权服务品牌推荐 - 拾光而行
  • 基于大语言模型的教育数字孪生:从学生认知模拟到个性化教学策略仿真
  • 科研党必备:用Matlab scatter画论文级散点图,从数据美化到子图排版一篇搞定
  • BARP框架:LLM智能路由与多模型调度优化实践
  • 河北明煌金属网栏:市政护栏全品类定制与交付服务商 - 奔跑123
  • 企业内网系统安全集成大模型api的taotoken实践方案
  • 2026收藏版|零基础自学大模型面试全复盘!小白程序员转行必看避坑攻略
  • 前端安全:安全审计实战指南
  • 杀疯了!7 款国内外 IDEA AI 插件大乱斗,谁是 AI Coding 世界第一?
  • CANN/elec-ops-inspection:电力巡检算子库
  • 黑盒式人工智能的终结?科学家开发出一种透明系统蓝图,该系统能够揭示其学习及决策过程
  • 企业私有化AI训练推理一体工作站/制造业AI质检工作站DLTM一站式AI训推解决方案
  • 别再混淆了!一文讲透AutoSAR里ComM通道与PNC集群的区别与联系