当前位置: 首页 > news >正文

【大模型】【扫盲】几种不同的微调方法

四种微调方式

image

Full

对预训练模型的所有参数进行微调,让模型从底层到顶层的所有参数都参与更新,彻底适配下游任务

优点:模型对任务的适配性最强,在数据充足、任务复杂时效果通常最优
缺点:资源消耗极大(千亿参数模型需高端 GPU 集群,训练时长以天 / 周计);数据量不足时极易过拟合(模型死记训练数据,泛化能力差)

适用于数据量大,复杂度高,计算资源充足的情景

Freeze

仅微调模型的部分参数(通常是 “顶层” 或新增的任务专属层,如分类头、输出层),冻结大部分底层参数(保留预训练阶段学到的通用知识)
适用于数据量少,任务简单,计算资源有限的场景

LoRA Low-Rank Adaptation

不直接修改预训练模型的原始参数,而是在模型的关键层(如注意力层、前馈网络层)插入低秩矩阵对(可理解为 “小配件”),仅微调这组低秩矩阵,原始模型参数保持冻结

在微调过程中,原始参数全程不更新

优点:训练速度极快、显存消耗极低;效果接近全量微调,且能完美保留原模型知识;支持多任务共享大模型
缺点:
若任务需要 “深度改造” 模型(如极小众领域的知识注入),低秩矩阵可能无法完全捕捉复杂规律,效果略逊于全量微调;
依赖 “低秩假设”,若任务与预训练任务差异过大,适配性会下降

适用于纯文本的任务,多任务场景,边缘设备部署等场景

QLoRA(Quantized LoRA,量化低秩适应)

是 LoRA 的升级版:先对预训练模型进行量化压缩(如 4 位量化,将浮点数参数转为低精度整数),再在量化后的模型上应用 LoRA 方法,仅微调新增的低秩矩阵

适合用在资源极其紧张的场景

http://www.jsqmd.com/news/17767/

相关文章:

  • Tuack 生成比赛题目 PDF 笔记
  • 在 wrapper 类里实现重载方法
  • Vue 项目 AI 文档增量更新工具操作手册
  • P7521 [省选联考 2021 B 卷] 取模 分析
  • 4060显卡也能玩转AI改图!Flux.1 Kontext Dev GGUF版本超详细入门教程 - 实践
  • 提升生产力:8个.NET开源且功能强大的快速开发框架
  • Mac版PDF Squeezer v4.5.1安装教程(DMG文件下载+详细步骤)​
  • 使用c++14标准实现函数注册包装
  • 【VSCode中Java创建环境安装的三个层级之Maven篇】(Windows版)
  • 详细揭秘:马拉车算法
  • 黑马程序员Java基础笔记
  • 实用指南:linux磁盘空间爆满排查与清理
  • 实用指南:socketpair深度解析:Linux中的“对讲机“创建器
  • 详细介绍:从零开始的C++学习生活 2:类和对象(上)
  • 【aigc】chrome-devtools-mcp怎么玩? - 指南
  • 2025年不锈钢酸洗钝化液厂家推荐排行榜,环保型不锈钢管酸洗钝化液,不锈钢清洗钝化液,酸洗钝化处理工艺及不锈钢清洗剂公司推荐
  • 记账:流水报表
  • 百度网盘非会员下载慢怎么解决 - fosgrignonhto
  • 嵌入式硬件——基于IMX6ULL的UART(通用异步收发传输器) - 教程
  • 20232418 2025-2026-1 《网络与系统攻防技术》实验二实验报告
  • CF1777E Edge Reverse
  • d435i 标定 imu和相机 用来复现vins_fusion - 教程
  • CSP-S 模拟赛 Day 19
  • K230基础-摄像头的使用 - 详解
  • CSP-S 模拟赛 Day 18
  • 2025年市面上高杆灯品牌前十强推荐榜:选购指南与行业洞察
  • 2025年市面上高杆灯品牌Top10权威推荐榜单
  • 2025年国内高杆灯十大品牌权威推荐榜单
  • 2025年市面上高杆灯品牌与国内公司口碑产品推荐榜单
  • 2025年给汤机/重力铸造自动化/机加工自动化厂家推荐榜单:专业设备与智能解决方案权威解析