当前位置：首页 > news >正文

大语言模型的后训练与“灾难性遗忘”问题——李宏毅2025大模型第六讲笔记 - 指南

news 2026/3/26 17:49:26

当你看到这样一个新闻：
“A 实验室/公司喜报：A采用某开源基座模型Q，经过后训练得到模型Q'，Q'在数学编程领域的得分超过Q。”
请思考这样的模型会有什么问题，Q'真的超过了Q吗？学习本节课，你将得到答案

什么？就是一、后训练（Post-training）

二、后训练的核心挑战——灾难性遗忘

典型案例

三、遗忘的根源

四、解决方案：让AI用自己的话学习

1. 经典经验回放

2. 伪经验回放

3. Self-Output 系列方法

4. 巧妙的解法：过滤高难度Token

五、结论与建议

一、后训练（Post-training）是什么？

后训练目标：将通用的“基础模型”变成特定任务或领域的“专才模型”。（如把Llama后训练后，变成金融、法律领域的专有模型）

后训练仍然沿用现有的模型训练范式：

预训练式：继续做文字接龙，使用领域文本。
有监督微调式：使用“指令-回答”对训练。
强化学习式：借助人类反馈优化模型。

二、后训练的核心挑战——灾难性遗忘

原有的通用知识记忆严重衰退，甚至完全丧失原有能力。就是“手术成功，但病人死亡”——模型学会了特定的新东西，但

典型案例：

1、学中文，忘安全

* 基座模型：LLaMA-2-Chat只用英文回答问题，问它危险问题LLaMA-2会拒绝回答

* 用中文后训练之后：LLaMA-2会用中文回答疑问，但安全对齐被破坏，开始回答危险问题。

2、即使用无害资料微调，模型的安全能力也会下降。[1]

3、专才代价是通才能力下降

* 提升某一能力（如编程），其他能力（如数学、语文）下降。

4、学新模态，忘旧格式

通过后训练，想教纯文本语言模型LLaMA识别语音
第一个Epoch：要求语言模型输出语音的情绪，并要求用json格式输出，模型输出错误的情绪，但是会用json格式输出结果（因为LLaMA知道什么是json）
多轮Epoch后：能输出正确的情绪，但模型忘记了如何输出JSON格式。

三、遗忘的根源

那么为什么模型会发生灾难性遗忘？原因如下

单目标优化：训练只优化新任务，不保护旧知识。
知识覆盖：新任务参数覆盖旧任务参数。
模型大小无关：研究1B-7B参数的模型，大小与遗忘程度无显著相关。而模型学的新知识越多，旧知识就遗忘得越厉害。
“学得少，忘得少”。就是LoRA 不能根本解决：只

四、解决方案：让AI用自己的话学习

1. 经典经验回放

在训练新任务时，混入5%旧任务数据，可有效防止遗忘。
问题：商业模型原始训练数据不可获取。

2. 伪经验回放

目前商业开源大模型的训练资料不可取，那就让模型自己生成旧任务数据，作为回放材料。

虽可能有事实错误，但能保留模型风格与知识结构。

3. Self-Output 系列方法

Mega-Pie：让模型自问自答，生成SFT数据。
Paraphrase答案改写：用模型自己改写后的答案训练。
self-output 选择性自我排练：模型答对时，用自己的答案训练；答错时才用人类答案。(这种方式跟RL-based的post-training很像）
“说我的语言”：用LLM生成的答案教另一个LLM，比只用人类数据集的效果更好。[2]

4. 巧妙的解法：过滤高难度Token

人类写的数据，总有一些词汇是模型输出的过程中，模型很难学到的（如截图）。那么在训练中忽略模型最难预测的Token，避免强制教学。可提升泛化能力，减少遗忘。[3]

五、结论与建议

遗忘不可避免：后训练本质是单目标优化，会干扰旧知识。
安全与通用能力最易丢失。
最有效策略：让模型用自己的话学习，保持训练目标与自身分布一致。
警示：看到某个模型说自己通过后训练，某个专项能力吊打xx模型，需要警惕，它可能失去了很多通用能力。

[1]Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!

[2]I Learn Better If You Speak My Language

[3]https://arxiv.org/abs/2501.14

查看全文

http://www.jsqmd.com/news/284147/

基于PLC的皮带机集成控制系统(设计源文件+万字报告+讲解)（支持资料、图片参考_相关定制）_文章底部可以扫码

COMSOL三维光子晶体结构设计与能带计算分析

ZYNQ MPSOC SD卡启动盘制作

北京地区top10研究生留学机构精选，无隐形消费服务详解

二维数组：矩阵存储与多维数组的内存布局

福州硕士留学机构哪家强？top10申请成功率高，备受学子青睐

学长亲荐9个AI论文工具，助你搞定研究生论文写作！

广州地区top10研究生留学中介解析，性价比高，值得关注

字符数组与字符串：C 风格字符串的处理技巧

深圳top10研究生留学机构有哪些？值得信赖的机构揭秘

FX3U三边封制袋机程序超音波型前后双伺服送料，模拟量控制变频器给料，所有切刀用的气缸，不是常用制袋机的电机凸轮

无锡硕士留学机构top10有哪些？权威解析，无隐形消费指南

在长沙寻找最好的研究生留学中介？学员满意度高的推荐在这里

郑州研究生留学中介口碑排名揭晓，无隐形消费成关键选择因素

救命神器2026 TOP10 AI论文软件：本科生毕业论文必备测评

探讨包装类印刷品专业印刷企业，如何选择合适的？

科耐仕新材料有限公司：品牌实力、核心产品与服务联系方式全览

基于PHP+MySQL开发组合的一站式跑腿小程序源码系统带完整的搭建部署教程

可定制化跑腿小程序源码系统，开源与私有化部署特点

2026进口热销品集合店加盟，代理挑选的实用指南，保健食品集合店/进口热销品集合店，进口热销品集合店加盟代理排行

CS106L Standard C++ Programming (施工中)

Comsol 超表面偏振转换：探索介质半波片与 1/4 波片设计

英语_阅读_Smart apps_待读

2026年当下靠谱的刀塔机工厂怎么选择，数控车床/4+4车铣/排刀机/四轴机/车铣复合/数控4+4，刀塔机品牌排行

2025年本地市场贯入式砂浆检测仪供应商口碑排行榜单揭晓，混凝土裂缝综合检测仪/数显高强回弹仪/混凝土回弹仪检测仪销售厂家排行

用React+Three.js 做 3D Web版搭建三维交互场景：模型的可视化摆放与轻量交互 - 指南

一、后训练（Post-training）是什么？

二、后训练的核心挑战——灾难性遗忘

典型案例：

三、遗忘的根源

四、解决方案：让AI用自己的话学习

1. 经典经验回放

2. 伪经验回放

3. Self-Output 系列方法

4. 巧妙的解法：过滤高难度Token

五、结论与建议

相关文章：