当前位置：首页 > news >正文

大模型微调——Fine-tuning

news 2026/7/11 4:50:46

以 GPT、Gemini、Qwen 为代表的大模型，已经具备了通用语言理解与生成能力，但在真实业务中，我们往往会遇到三个问题：

1 领域不匹配：专业领域如金融、法律、生物信息等，术语密集、表达规范，大模型只能“懂个大概”，但不够专业。

2 任务不聚焦：有时候我们希望模型稳定地完成某一类或几类任务（如分类、代码补全），而不是“什么都会一点”。

3 风格与约束：通用大模型的回复格式、语气、推理路径、合规要求，往往需要被“教会”，而不是靠 prompt 碰运气。

那么这时候，我们就需要微调（Fine-tuning）来让大模型“从通才变专家”。

大模型微调的分类

一

Full Fine-tuning（全参数微调）

全参数微调，顾名思义，就是模型的所有参数都参与反向传播，所有参数都进行调整，本质是在原模型基础上“整体再训练一遍”，更像“重塑一个新模型”。其特点如下：

理论性能上限最高
不需要在模型里引入额外结构
计算和存储成本高
容易过拟合 / 灾难性遗忘

PEFT（Parameter-Efficient Fine-Tuning，参数高效微调）

PEFT，与FFT相比，并不更新模型的所有参数，其冻结原模型参数，而额外只训练少量额外参数。众多PEFT方法中，LoRA（Low-Rank Adaptation）是目前最主流、工程上最成熟的方案。与FFT相比，特点如下：

Full Fine-tuning	LoRA（PEFT）
需训练参数	100%	通常 <1%
训练成本	非常高	显著降低
小数据稳定性	较差	很好
多任务扩展	困难	容易

代码的实现

二

Full Fine-tuning

#1 加载预训练模型 model = torch.load(args.pretrain_checkpoint) model = model.to(device) #超参数 #--- Prepare Optimizer ---# optimizer = optim.Adam(model.parameters(), lr=args.lr, amsgrad=True) #--- Prepare Scheduler ---# scheduler = StepLR(optimizer, step_size=args.gamma_step, gamma=args.gamma) #2 准备微调训练集 my_trainset = SCDataset(train_rna, train_protein, args.enc_max_seq_len, args.dec_max_seq_len) my_testset = SCDataset(test_rna, test_protein, args.enc_max_seq_len, args.dec_max_seq_len) train_loader = torch.utils.data.DataLoader(my_trainset, **train_kwargs, drop_last=True, sampler=train_sampler) test_loader = torch.utils.data.DataLoader(my_testset, **test_kwargs, drop_last=True, sampler=test_sampler) #3 FFT训练 for epoch in range(start_epoch+1, args.epochs + 1): torch.cuda.empty_cache() train_loss, train_ccc = train(args, model, device, train_loader, optimizer, epoch) scheduler.step() #4 保存最终模型 model.save_pretrained("./full_ft/final_model")

Low-Rank Adaptation (LoRA)

from peft import LoraConfig, get_peft_model # ========================= # 1. 加载预训练模型 # ========================= model = torch.load(args.pretrain_checkpoint) model = model.to(device) # ===== 新增：LoRA 配置 ===== lora_config = LoraConfig( r=8, lora_alpha=32, lora_dropout=0.1, bias="none", task_type="SEQ_2_SEQ_LM", target_modules=["q_proj", "v_proj"] ) # ===== 新增：包装为 PEFT / LoRA 模型 ===== model = get_peft_model(model, lora_config) # 可选但强烈推荐：确认只有 LoRA 在训练 model.print_trainable_parameters() # ========================= # 超参数,准备优化器 & Scheduler # ========================= optimizer = optim.Adam( filter(lambda p: p.requires_grad, model.parameters()), lr=args.lr, amsgrad=True ) scheduler = StepLR( optimizer, step_size=args.gamma_step, gamma=args.gamma ) # ========================= # 2. 准备微调训练集 # ========================= my_trainset = SCDataset( train_rna, train_protein, args.enc_max_seq_len, args.dec_max_seq_len ) my_testset = SCDataset( test_rna, test_protein, args.enc_max_seq_len, args.dec_max_seq_len ) train_loader = torch.utils.data.DataLoader( my_trainset, **train_kwargs, drop_last=True, sampler=train_sampler ) test_loader = torch.utils.data.DataLoader( my_testset, **test_kwargs, drop_last=True, sampler=test_sampler ) # ========================= # 3. PEFT（LoRA）训练（流程不变） # ========================= for epoch in range(start_epoch + 1, args.epochs + 1): torch.cuda.empty_cache() train_loss, train_ccc = train( args, model, device, train_loader, optimizer, epoch ) scheduler.step() # ========================= # 4. 保存最终模型（LoRA adapter） # ========================= model.save_pretrained("./lora_adapter")

这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

👇👇扫码免费领取全部内容👇👇