当前位置: 首页 > news >正文

LLaMA-Factory 微调模型一

数据集选择

想要微调模型,首先就需要有合适的数据。本次微调模型的目标是训练出一个适合本地部署的翻译模型,因此我选用这个数据集:
WMT-Chinese-to-English-Machine-Translation-Training-Corpus
但是因为使用的微调工具是 LLaMA-Factory,它只支持 Alpacasharegpt 格式的训练集,因此我们还需要对原始数据集进行加工,将其转换为 Alpaca 格式。

数据集格式转换

Alpaca 格式

Alpaca 格式主要包含三个核心字段:

{"Instruction": "将以下内容翻译为中文","input": "The weather is very nice today","output": "今天的天气非常好"
}
  • instruction:明确的任务指令(必须存在)
  • input:任务输入内容(可以为空)
  • output:期望的输出结果(必须存在)

使用 python 脚本转换数据格式

WMT 中英机器翻译训练集为 CSV 格式,由两列构成,第一列为中文,第二列为英文。
使用下面的 python 脚本可以将 CSV 格式转换为 Alpaca 格式:

import pandas as pd
import json# === 输入与输出路径 ===
input_csv = "path/to/your/train.csv" # 你的原始 CSV 文件
output_json = "wmt_zh_en_alpaca.json" # 输出的 Alpaca 格式 JSON 文件# === 读取 CSV 文件 ===
df = pd.read_csv(input_csv)# 检查列名
if not {'zh', 'en'}.issubset(df.columns):raise ValueError("CSV 文件应包含列名 'zh' 和 'en'")data = []# === 方向:英文 -> 中文 ===
for _, row in df.iterrows():zh, en = row['zh'], row['en']if isinstance(zh, str) and isinstance(en, str):data.append({"instruction": "Translate the following English sentence into Chinese","input": en.strip(),"output": zh.strip()})# === 保存为 JSON 格式 ===
with open(output_json, "w", encoding="utf-8") as f:
json.dump(data, f, ensure_ascii=False, indent=2)print(f"✅ 转换完成,共 {len(data)} 条样本,已保存为:{output_json}")

因为我的目标是让这个模型能够将英文翻译为中文,因此脚本中调整了中英文本顺序。
最后会输出一个 .json 文件,这个文件将会在后面作为数据集使用。

使用 LLaMA-Factory 进行模型微调

下载 LLaMA-Factory

这里有两种方式下载并使用 LLaMA-Factory:

从源码安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]" --no-build-isolation

使用 Docker 安装

docker run -it --rm --gpus=all --ipc=host hiyouga/llamafactory:latest

不了解 Docker 的直接从源码安装就行。

添加数据集

将上面生成的 .json 文件复制到 data 文件夹中并编辑 data/dataset.json,在其中添加这几行:

  "wmt_zh_en_alpaca": {"file_name":  "wmt_zh_en_alpaca.json"},

下载模型权重

想要微调某个模型,就需要该模型的权重,本次微调以Qwen3:0.6B模型为基础模型:

modelscope download --model Qwen/Qwen3-0.6B --local_dir ./Qwen3-0.6B

配置训练脚本

编辑 examples/train_lora/qwen3-0.6b-lora-sft.yaml 文件

### model
model_name_or_path: ./Qwen3-0.6B
trust_remote_code: true### method
stage: sft
do_train: true
finetuning_type: lora
deepspeed: ds_z3_config.json  # choices: [ds_z0_config.json, ds_z1_config.json, ds_z2_config.json, ds_z3_config.json]### dataset
dataset: wmt_zh_en_alpaca
template: qwen
cutoff_len: 2048
#### 这里只选了1000个样本,可以根据需要适当调整
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 4
dataloader_num_workers: 2### output
output_dir: saves/qwen3-0.6b/lora/sft
logging_steps: 1
save_steps: 1500
plot_loss: true
overwrite_output_dir: true
save_only_model: false
report_to: tensorboard  # choices: [none, wandb, tensorboard, swanlab, mlflow]
logging_dir: saves/qwen3-0.6b/lora/sft/tensorboard-log### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 4
learning_rate: 1.0e-5
#### 可以修改下面的数字改变训练轮数
num_train_epochs: 1.0
lr_scheduler_type: cosine
warmup_ratio: 0.1#bf16: true
fp16: true
ddp_timeout: 180000000
resume_from_checkpoint: null#gradient_checkpointing: true
use_unsloth_gc: true

模型微调训练

使用下面的命令进行模型训练:

nohup llamafactory-cli train examples/train_lora/qwen3-0.6b-lora-sft.yaml > train_lora_sft_qwen3-0.6B.log &

使用下面的命令实时监控训练过程:

tail -f train_lora_sft_qwen3-0.6B.log
http://www.jsqmd.com/news/50534/

相关文章:

  • 洛谷题单指南-组合数学与计数-P3223 [HNOI2012] 排队
  • 102302138 林楚涵 作业三
  • 西安一对一家教辅导实用测评:2025阎良、临潼等地区辅导机构全维度对比
  • 桂林小学一对一补习机构终极评测:2025七星、雁山等地区热门辅导机构真实评测
  • rust语言枚举类型enum与模式匹配
  • 11.22 NOIP 模拟赛 T1. 破乱的诗歌
  • 莆田一对一家教辅导榜单更新:2025口碑最好的补习机构
  • 学习Linux需要买云服务器吗
  • 优化脚本
  • 黑白调E3 Pro:以超 300 项专利与顶尖人体工学,重塑玩家竞技体验
  • 漳州一对一辅导机构终极榜单:2025最新十大辅导机构实力排名
  • 广西一对一辅导机构终极评测:贺州、河池、来宾、崇左等地区2025补习机构权威评测优选
  • 2025 最新推荐!常州连接线线束厂家权威榜单:品控标准、定制能力与头部合作案例全景测评 LED / 电动工具 / 汽车零部件 / 家用电器电子连接线线束 / 汽车专用线束公司推荐
  • 篡改猴脚本失效解决办法
  • 2025 年打包带源头厂家最新推荐榜:ISO 认证 + 日产 20 吨级实力厂商,物流仓储优选权威榜单高亮打包带/塑钢打包带/PP 打包带/PET 打包带/纯新料打包带厂家推荐
  • MATLAB实现光谱数据预处理
  • 2025年5家美国绿卡申请专业机构深度评测!哪家最适合你?
  • 9 OpenCV中的形态学
  • 2025 年 11 月法兰绒面料厂家推荐排行榜,法兰绒布料,双面法兰绒,优质法兰绒面料,柔软保暖与高性价比之选
  • 告别稀疏发际线!2025值得入手的防脱洗发水推荐,根源防脱告别掉发
  • 用python实现简单的机器学习
  • 1125noip模拟赛
  • 2025 年 11 月珊瑚绒厂家推荐排行榜,珊瑚绒布料,珊瑚绒面料,珊瑚绒布,双面珊瑚绒,柔软亲肤保暖面料公司精选
  • 2025年学历提升、成人学历、专升本、自考本科、高起专服务机构综合评测与精选推荐
  • yymodel 某个属性当iOS以int接受 而接口返回null,json解析会崩溃不
  • 2025年穿线磁珠编带磁环制造企业权威推荐榜单:铁氧体磁环/非晶纳米晶磁环/磁环源头厂家精选
  • 2025年下半年新疆学历提升、成人学历、专升本、自考本科、高起专机构全面评测与选择指南
  • 2025年11月中国电线电缆厂家推荐榜单:权威评测与综合排名分析
  • AI搜索营销新蓝海:五家领先GEO服务商全景透视与战略布局指南
  • 2025年AI搜索时代五大GEO优化服务商全景解析:核心优势与行业适配指南