当前位置: 首页 > news >正文

CANN/cann-learning-hub:Swan LLM 大模型实战课程

【免费下载链接】cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。项目地址: https://gitcode.com/cann/cann-learning-hub

SwanLab x CANN 社区合作课程


Swan LLM 大模型实战课程

课程作者与联系方式

  • 作者:韩翔宇(情感机器 SwanLab 实验室 AI 研究员)等
  • 邮箱:pescn@115lab.club
  • 课程背景:本课程内容来源于 CANN 社区与 SwanLab 团队正在开展的线下启航营,面向高校同学讲解昇腾算力上的大语言模型训练、对齐、推理与加速。如果你所在的学校 / 社团 / 实验室希望接入这套教材,或者希望在你们学校落地一期启航营,欢迎通过讨论区或邮件联系。

课程简介

本课程面向高校在校学生,结合正在开展的线下启航营实践内容,围绕大语言模型在昇腾 NPU 上的基础理论 → 微调 → 强化学习 → 推理部署 → 性能调优展开。我们希望通过这套课程,帮助同学们:

  • 建立大模型从训练到部署的完整心智模型,而不是孤立地学某一个工具
  • 真正理解微调(SFT / LoRA)、强化学习对齐(RLHF / DPO / GRPO)的工程实现细节
  • 在昇腾 NPU + CANN 的真实硬件上完成训练 / 推理,体会国产算力栈下的工程权衡
  • 通过 AscendC 自定义算子优化实战,理解大模型训练 / 推理性能瓶颈的来源及优化思路

适合人群

建议学习者具备 Python 基础和线性代数基础。但不要求事先有 Ascend C 经验

  • 对大模型有兴趣,但还没真正跑通一次端到端训练 / 部署的本科生 / 研究生
  • 已经在其他智算卡上跑过 transformers / trl,想了解昇腾 NPU 上有什么不一样的同学
  • 想理解为什么大家都在写自定义算子,并亲手优化一次的同学

课程目录

章节标题内容概要状态
01大语言模型基础理论介绍Transformer、自注意力、预训练 / SFT / RLHF 三段式、推理与 KV cache建设中
02大语言模型微调Qwen3 全参数 SFT、LoRA 微调、Loss Mask、AST + 可执行性评估已发布部分节次
03大语言模型强化学习RLHF / PPO、DPO、GRPO,以代码可执行性作为奖励信号的案例建设中
04大语言模型推理部署KV cache、continuous batching、量化、推理引擎与服务化建设中
05性能调优AscendC 自定义算子接入 PyTorch、Amdahl 律、推理 / 训练端到端加速已发布部分节次

已发布节次速览

节次标题
02.04Qwen3 基座模型指令微调(SFT)
05.02SwanRmsNorm AscendC 算子加速 Qwen3 微调

目录与命名规范

每个章节目录的统一约定如下:

0X_<chapter_slug>/ ├── README.md # 章节定位、节次清单、运行说明 ├── 0X.01_<section_slug>.ipynb # 节次 Notebook ├── 0X.02_<section_slug>.ipynb ├── data/ # 节次配套数据集(可选) ├── pdf/ # 节次配套 PDF(可选) ├── images/ # 章节配图(可选) └── answer/ # 实操题参考答案(可选)

运行环境

项目推荐配置
硬件昇腾 910C / 910B
软件CANN ≥ 8.5、Python 3.10/3.11、PyTorch 2.x +torch_npu
平台推荐 CANNLab
第三方SwanLab(实验可视化)、ModelScope(模型与数据集下载)、TRIO

反馈与贡献

发现 Notebook 里的 bug、对某一章节有改进建议,或希望补充占位章节的内容,欢迎在 cann/cann-learning-hub 仓库提 Issue 或 PR。


如果这套课程帮到了你,欢迎给本课程项目点个 Star ⭐,分享给更多对大模型感兴趣的同学!

【免费下载链接】cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。项目地址: https://gitcode.com/cann/cann-learning-hub

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/853257/

相关文章:

  • 2026年AI语音聊天工具横评:6款实测对比,哪款真的能聊?
  • Multisim 14.0卸载后重装总失败?可能是这3个隐藏文件夹和注册表项在捣鬼
  • Kubernetes Operator 开发实践:从 CRD 到控制器
  • 2026年河南少林武术学校最新推荐榜:少儿武术培训/青少年武术集训/专业武术深造/武术考级辅导/国际武术交流 - 海棠依旧大
  • Purple Pi OH开发板Android 11系统ROOT权限获取与Magisk实战指南
  • changzengli/yolo-onnx-java容错机制实现详解
  • 深入理解ops-tensor架构:模块化算子库的设计哲学与实现
  • 5. 损失函数
  • CANN数学不相等算子V2
  • 鸣潮游戏体验重塑:WuWa-Mod模组深度解析
  • 2026深度分析罗兰艺境B2B企业服务-仪器校准GEO技术案例,测评广州中广测计量检测优化过程与效果验证 - 罗兰艺境GEO
  • HC32F4A0外设引脚自由配置全攻略:如何像STM32重映射一样灵活规划你的原理图?
  • 解析2026年耐高温PPS塑料厂家的专业特性与应用优势
  • 一套代码适配四种屏幕——StyleConfiguration 键盘多设备适配方案
  • CANN ops-fft安全最佳实践:确保AI计算平台FFT算子的安全运行
  • 别再只用DS18B20了!用51单片机+ADC0804做个PT100温度计(附完整代码和Proteus仿真)
  • 虚拟显示器驱动ParsecVDD:解决游戏串流与远程办公的显示难题
  • Windows缩略图加载太慢?这款智能预加载工具让文件浏览快如闪电
  • CANN/catlass精度分析基础
  • CANN/catlass A2至950迁移指导
  • C++二叉树构建、深拷贝与可视化输出实战解析
  • 电力系统时序一致性保障:elec-ops-prediction的长时序稳定性约束实现
  • TTK开发者指南:如何贡献代码和扩展功能的10个实用技巧
  • DS18B20时序不稳?一个中值滤波函数帮你搞定所有异常数据(附C代码)
  • 解析2026年新能源PPS材料供应商关键技术与发展路径
  • 昇腾C解交织API文档
  • G-Helper完整指南:3分钟掌握华硕笔记本性能优化神器
  • CANN/catlass LayoutTag(旧版Layout)
  • 靠谱的远程手机控制软件 远程控制手机推荐用无界趣连2.0
  • CANN/.gitcode缺陷报告模板深度解析:如何高效提交昇腾AI问题反馈