当前位置: 首页 > news >正文

模型单机多卡训练笔记

## 一.训练前准备

- 1.平台账号与链接:https://autodl.com/home

- 2.训练数据准备**

- 这里以酒店评论数据sentiments.json、以及自我认知identity.json为例

- 将这两个文件标准化为Alpaca格式,如下所示:

~~~

{

"prompt": "instruction", # 指令

"query": "input", # 用户输入,可选

"response": "output", 模型输出

"system": "system" # 系统设置

}

- 在 dataset_info.json 中对训练数据进行注册,如下所示:

~~~

"sentiments": {

"file_name": "sentiments.json",

"columns": {

"prompt": "instruction",

"query": "input",

"response": "output",

"system": "system"

}

}

## 二.训练配置

- 1.打开autodl算力云平台:https://autodl.com/

- 登录账号:

- 配置算力:

- 算力市场/佛山区

- 型号:V100-32GB(43/88)

- GPU 数量:2(这里我选了两张卡,大家按实际情况来)

- 镜像:PyTorch/2.5.1/3.12(ubuntu22.04)/ 12.4

- 点击“创建并开机”按钮,

- 点击快捷工具列下的“jupyterLab ” 进入编辑器环境

- 2. 升级并安装 git-lfs,因为普通的 git clone 只会下载指针文件(几百字节),而不是真正的权重文件。

- 安装命令:

apt-get update && apt-get install -y git-lfs

git lfs install

- 3.下载模型 ,比如我这里以Qwen2.5-0.5B-Instruct为例:

- 逐行命令

git clone https://www.modelscope.cn/Qwen/Qwen2.5-0.5B-Instruct.git

cd Qwen2.5-0.5B-Instruct

git lfs pull

- 这时候看到核心的 model.safetensors 权重文件,大小差不多为1GB,说明文件已经正常下载了

- 4.下载LLaMA-Factory,以及安装及依赖包

- 可以选择git命令,也可以选择本地上传压缩包之后再解压

- 安装依赖包

- cd LLaMA-Factory

- pip install -e ".[torch, metrics]"

- 5.安装deepseek(做并行计算的)

- cd LLaMA-Factory

- pip install deepspeed

### 三、训练文件上传与训练预设文件设置

- 1.环境都准备好之后,上传之前准备好的数据文件,以及修改好data文件夹中的数据注册文件dataset_info.json

- 保证dataset_info.json无误:注册数据名称、路径、数据格式

- 2.训练显存监控,定时刷新命令如下:

- watch -n 2 'nvidia-smi'

- 每隔2s刷新一次

- 设置训练预设文件

- 选择正确的训练模板:在\LLaMA-Factory\examples\train_full> 中复制llama3_full_sft.yaml 文件

- 修改文件名为:QWen2.5_0.5B_Instruct_full_sft

- 修改文件中的参数

- model_name_or_path: /root/Qwen2.5-0.5B-Instruct

- dataset: identity,alpaca_en_demo,alpaca_zh_demo,sentiment

- template: qwen

- max_samples: 10000

- output_dir: /root/autodl-tmp/outputs/Qwen2.5-0.5B-Instruct

- save_steps: 10000

- per_device_train_batch_size: 2

- gradient_accumulation_steps: 1

- 设置好之后,将文件存到LLaMA-Factory目录下,这个路径很重要,要与后面的命令路径对上

- 3.一切就绪,切换到LLaMA-Factory目录下

- cd LLaMA-Factory

- 开始训练:FORCE_TORCHRUN=1 llamafactory-cli train QWen2.5_0.5B_Instruct_full_sft.yaml

### 四.等待训练结果,可以进行批量推理和模型评测

- 评测代码如下:

CUDA_VISIBLE_DEVICES=0 llamafactory-cli eval \

--model_name_or_path /root/autodl-tmp/outputs/Qwen2.5-0.5B-Instruct \

--template qwen \

--task cmmlu_test \

--lang zh \

--n_shot 5 \

--batch_size 4 \

--trust_remote_code True

### 五.模型训练好之后,可以封装成服务调用,后面再记录一下这部分的内容





























http://www.jsqmd.com/news/965090/

相关文章:

  • 2026年更新:深度解析非标无动力游乐设备实力厂家的选择之道 - 2026年企业资讯
  • 2025年09月 GESP等级认证C++编程(一级)试题解析
  • 别再为多重共线性发愁了!用Python的sklearn快速上手岭回归实战
  • 2022年软考-公司人事管理—软件设计师—东方仙盟
  • 2026年当下,如何选择一家靠谱的烘焙烤箱销售厂家?这份业内推荐请收好 - 2026年企业资讯
  • 瑞德克斯信息服务平台节奏易懂吗?
  • 实打实口碑!2026年6月上海松江区靠谱银元回收+老银锭回收店铺推荐 - 沪上贵金属口碑推荐官
  • 2026年 松下万宝压缩机厂家推荐:高效节能/稳定耐用的空调与冷柜压缩机优选品牌解析 - 品牌企业推荐师(官方)
  • SPI驱动开发实战:轮询、中断与DMA模式详解与性能优化
  • 2026年Q2非晶带焊料评测:银焊膏、锡焊膏、锡青铜焊膏、镍焊膏、阻流剂、预制成型件、颗粒焊料、黄铜焊膏、定制焊料选择指南 - 优质品牌商家
  • 黑客必备的一体化黑客工具
  • TMS320F280049C ADC实战:从ePWM触发到多通道采样,一个电机控制工程师的配置笔记
  • Solidity Gas 优化底座:从 EVM 字节码、Opcode 内存布局到 Yul 汇编底层压榨算力实战
  • 后端 API 设计:RESTful 与 GraphQL 的架构权衡与实战选择
  • 别再纠结了!手把手教你为STM32项目挑选最合适的调试器(J-Link/ST-Link/CMSIS-DAP对比)
  • 银行级机器学习系统:从模型上线到生产就绪的工程实践
  • 国内预制成型钎焊制品供应商综合实力排行盘点:金基焊料/钛基焊料/钯基焊料/铝焊膏/银焊膏/锡焊膏/锡青铜焊膏/镍焊膏/选择指南 - 优质品牌商家
  • 2026年 重锤料位计厂家推荐:精准测量/抗粉尘/耐高温,工业物位监测优质品牌深度解析 - 品牌企业推荐师(官方)
  • CSDN AI数字营销权限体系深度拆解(含官方未公开的L4-L6高阶权限清单)
  • 2026年通辽市名气TOP5装饰公司客观盘点:通辽靠谱装修/通辽二手房翻新/通辽别墅装修/通辽大宅装修/通辽大平层装修/选择指南 - 优质品牌商家
  • 导入模板下载
  • 别再为多重共线性头疼了!用sklearn的RidgeCV和Lasso搞定你的回归模型(附Longley数据集实战)
  • 微软董事霍夫曼将不参与连任竞选,欲专注人工智能药物研发初创公司
  • 2026年FY不锈钢液下泵权威品牌TOP5盘点:耐腐泵/耐腐耐磨液下泵/耐腐耐磨砂浆泵/耐腐耐腐循环泵/耐腐蚀离心泵/选择指南 - 优质品牌商家
  • 基于 Harmony 6.0 应用的健身训练计划生成器实现
  • C语言如何直接控制硬件指针、内存与寄存器
  • 思源宋体终极指南:7种字体样式完全免费商用方案
  • JVM 内存碎片治理:Java 堆外内存泄露诊断与 G1 混合垃圾回收区域(Mixed GC)碎片整理优化实战
  • 2026年主流陶瓷切削液供应商实力盘点:切削油、半合成切削液、氧化锆切削液、淬火油、淬火液、清洗剂、玻璃镜头切削液选择指南 - 优质品牌商家
  • 进一步优化LLM-Wiki大模型知识库,构建场景驱动的认知闭环