当前位置: 首页 > news >正文

《动手学大模型》深度技术解析:从微调部署到智能体安全的完整编程实践

《动手学大模型》深度技术解析:从微调部署到智能体安全的完整编程实践

一、项目概述

《动手学大模型》(dive-into-llms)是由上海交通大学《自然语言处理前沿技术》(NIS8021)、《人工智能安全技术》(NIS3353)课程讲义拓展而来的系列编程实践教程。项目旨在提供大模型相关的入门编程参考,通过简单实践帮助开发者快速入门大模型,更好地开展课程设计或学术研究。

本项目联合华为昇腾推出了《大模型开发全流程》公益教程,覆盖 PPT、实验手册和视频三种教程形式。

核心特性:

  • 11 个主题,覆盖从微调到智能体安全的完整知识体系
  • 源自上海交通大学研究生课程讲义
  • 联合华为昇腾推出国产化《大模型开发全流程》教程
  • 每个主题含课件、教程文档和 Jupyter Notebook 实践脚本
  • 完全免费、公益性质
  • 二、技术原理

    2.1 教程体系设计

    项目按从基础到前沿的渐进式设计,涵盖 11 个核心主题:

    | 主题 | 核心内容 | 实践脚本 | |------|----------|----------| | 微调与部署 | 预训练模型微调与部署指南,选择合适的模型在特定任务上微调并部署为 Demo | dive-tuning.ipynb | | 提示学习与思维链 | 大模型 API 调用与推理,"AI 在线求鼓励?它可能只是想要一句鼓励" | dive-prompting.ipynb | | 知识编辑 | 语言模型的编辑方法和工具,操控模型对指定知识的记忆 | dive_edit.ipynb | | 数学推理 | 如何让大模型学会数学推理,快速蒸馏一个迷你 R1 | sft_math.ipynb | | 模型水印 | 在语言模型生成内容中嵌入人类不可见的水印 | watermark.ipynb | | 越狱攻击 | 了解越狱攻击如何"撬开大模型的嘴" | dive-jailbreak.ipynb | | 大模型隐写 | 让大模型在流畅回答的同时悄悄携带隐藏信息 | llm_stega.ipynb | | 多模态模型 | 多模态大语言模型的理解和生成能力,能否帮助实现 AGI | mllms.ipynb | | GUI 智能体 | 让 AI Agent 替你点外卖、回消息、购物比价 | GUIagent.ipynb | | 智能体安全 | 大模型在开放智能体场景中能否意识到风险威胁 | agent.ipynb | | RLHF 安全对齐 | 基于 PPO 的 RLHF 实验指南 | RLHF.ipynb |

    2.2 关键技术深度解析

    微调与部署

    教程从预训练模型的选择开始,涵盖:

  • LoRA/QLoRA 等参数高效微调方法
  • 模型部署为 Gradio/Web Demo
  • 推理优化(量化、批处理)
  • 提示学习与思维链

    深入讲解:

  • Zero-shot / Few-shot 提示工程
  • Chain-of-Thought(思维链)推理
  • Tree-of-Thought、Graph-of-Thought 等高级提示方法
  • 大模型 API 调用的最佳实践
  • 知识编辑

    语言模型编辑是 NLP 前沿方向,涉及:

  • ROME(Rank-One Model Editing)算法
  • MEMIT(Mass-Editing Memory in a Transformer)方法
  • 编辑效果的验证与评估
  • 大模型安全

    项目的亮点之一——系统性地讲解大模型安全问题:

  • 越狱攻击:通过对抗性提示绕过安全限制
  • 模型水印:在生成文本中嵌入可追踪的不可见标记
  • 大模型隐写:在流畅回答中携带只有"自己人"能识别的信息
  • 智能体安全:Agent 在开放场景下的风险意识与防护
  • RLHF 安全对齐:基于 PPO 的强化学习人类反馈对齐
  • GUI 智能体

    教程覆盖 GUI Agent 的前沿研究:

  • 视觉理解与界面元素识别
  • 任务规划与动作执行
  • 多模态输入(截图 + 文本指令)
  • 三、安装与快速开始

    3.1 环境要求

  • Python 3.8+
  • Jupyter Notebook / JupyterLab
  • 深度学习框架(PyTorch)
  • GPU 资源(推荐,部分实验可在 CPU 上运行)
  • 3.2 安装步骤

    # 克隆项目
    git clone https://github.com/Lordog/dive-into-llms.git
    cd dive-into-llms

    安装依赖(各章节可能有独立的 requirements.txt)

    pip install torch transformers jupyter notebook

    3.3 最简运行示例

    以微调教程为例:

    # 打开 Jupyter Notebook
    jupyter notebook documents/chapter1/dive-tuning.ipynb
    

    按照课件和教程文档逐步执行即可。

    3.4 《大模型开发全流程》教程

    联合华为昇腾推出的国产化教程,分为初级、中级、高级三个系列,面向不同的大模型实践需求。基于昇腾基础软硬件开发,覆盖 PPT、实验手册、视频等教程形式。

    前往 昇腾社区大模型开发学习专区 探索

    四、使用方法与实战

    4.1 课程学习路径

    推荐学习顺序: 1. 微调与部署 → 理解基础微调流程 2. 提示学习与思维链 → 掌握 Prompt 工程 3. 知识编辑 → 学习模型知识更新 4. 数学推理 → 蒸馏迷你推理模型 5. 安全专题(水印、越狱、隐写、智能体安全、RLHF)→ 理解安全问题 6. 多模态与 GUI Agent → 探索前沿方向

    4.2 学术研究参考

    本教程可作为课程设计和学术研究的入门参考:

  • 每个主题都提供了课件(PDF)和可运行的 Notebook
  • 代码示例清晰标注,便于理解和复现
  • 4.3 贡献与扩展

    项目欢迎 PR 贡献:

  • 新增教程主题
  • 修复代码错误
  • 改进文档和注释
  • 添加新的实验和案例
  • 五、常见问题与解决方案

    5.1 Notebook 运行失败

    确保安装了正确版本的依赖包。各章节的 Notebook 顶部通常标注了所需的库版本。

    5.2 GPU 内存不足

    部分实验(如 RLHF)对 GPU 内存要求较高。可尝试:

  • 使用更小的模型(如 Qwen2.5-7B 代替 72B)
  • 启用 QLoRA 量化微调
  • 使用 Colab / Kaggle 的免费 GPU
  • 5.3 昇腾环境适配

    《大模型开发全流程》教程基于昇腾软硬件开发。如果使用的是 NVIDIA GPU,需要适当修改代码(主要是设备相关的 API 调用)。

    5.4 越狱攻击实验注意事项

    教程中的越狱攻击实验仅用于学术研究和安全教育,请勿用于非法目的。

    六、总结

    《动手学大模型》系列教程是中文大模型教育领域的重要开源项目。11 个主题覆盖了从基础的微调部署到前沿的智能体安全、模型水印、隐写术等方向,每个主题都配有课件、教程和实践脚本。联合华为昇腾推出的《大模型开发全流程》进一步扩展了国产化实践内容。对于想要系统学习大模型技术的开发者和学生来说,这是一份不可多得的优质资源。

    GitHub 地址: https://github.com/Lordog/dive-into-llms


    稳定可靠低价的AI中转站:X API

    http://www.jsqmd.com/news/798960/

    相关文章:

  • Windows系统DLL问题完全解决方案:Visual C++运行库智能修复工具实战指南
  • K8s原生ML编排进入“编译期优化”时代(SITS 2026首次披露:eBPF驱动的模型感知调度器Alpha版已交付头部5家云厂商)
  • 别再只调pool_size了!MaxPool2D的strides和padding参数实战避坑指南(附TensorFlow/Keras代码)
  • 2026年浙江复古女鞋产业深度解析:实力供应链如何重塑市场格局 - 2026年企业推荐榜
  • 终极指南:3分钟为Minecraft安装专业级光线追踪效果
  • Thorium浏览器实战:深度解密90号元素如何重塑Chromium体验
  • 从辉煌到衰落:47 年沉浮的 dBase,AI 助力用户逃离困境
  • 2026年第二季度湖南密封胶服务商深度**:长沙楚添科技有限公司为何脱颖而出? - 2026年企业推荐榜
  • BT手游这样玩才不花冤枉钱
  • Python并发模型全景解析
  • Stable Diffusion WebUI 深度技术解析:AI 图像生成的瑞士军刀
  • 用PTA题库学C语言:手把手教你拆解‘选择与循环’的嵌套逻辑
  • 跑刀仔【牛客tracker 每日一题】
  • HS2-HF Patch:终极汉化与MOD整合解决方案
  • Google Docs × Gemini智能写作实战手册(2024企业级落地白皮书)
  • 易语言大漠模块截图实战:从静态BMP到动态GIF,手把手教你封装Capture系列命令
  • 2026年5月更新:济南企业如何筛选靠谱的软件功能测试服务商? - 2026年企业推荐榜
  • 深度拆解——Google 工程总监如何把“资深工程师纪律“封装成 22 个可执行 Skill
  • STK Astrogator模块避坑指南:从Target Sequence优化失败到成功收敛的5个关键设置
  • AI原生图计算不是“加个GNN层”那么简单:SITS 2026定义的5层工程化成熟度模型(附自测清单+迁移路线图)
  • 深入探讨IntelliJ IDEA和PyCharm的全局查找替换功能
  • OpenWrt固件DIY:给MT7628路由器添加开机自启的TCP串口服务器(ser2net配置指南)
  • CompressO:免费开源视频图片压缩工具,三分钟掌握专业级文件瘦身技巧
  • 巧妙实现React中的单行删除按钮
  • 2026年5月更新:海口代理记账服务商深度**,海南上捷财务咨询有限公司表现如何? - 2026年企业推荐榜
  • 从矿石收音机到软件定义无线电(SDR):手把手带你复现AM广播接收全流程
  • 互联网大厂Java求职面试:从Java SE到Maven的深度探讨
  • QMCDecode终极指南:5分钟让QQ音乐加密文件重获自由!
  • 仅限首批Beta开发者访问的Gemini Calendar高级API权限池即将关闭——现在掌握这6个私有端点将决定你团队的2025排期话语权
  • 解锁音乐自由:用纯C语言工具将网易云NCM文件转为MP3