当前位置：首页 > news >正文

从零部署YOLOv5人脸检测：环境搭建、数据标注到实时应用

news 2026/6/29 9:18:03

1. 环境准备：从零搭建YOLOv5开发环境

第一次接触YOLOv5时，我花了两天时间才把环境配好，主要卡在CUDA和PyTorch版本兼容问题上。后来发现其实用conda管理环境特别方便，这里分享我的踩坑经验。建议使用Ubuntu 20.04系统，实测NVIDIA驱动安装最稳定。先确保你的显卡驱动正常，运行nvidia-smi能看到显卡信息。

安装Anaconda后，创建一个专门的环境：

conda create -n yolov5 python=3.8 conda activate yolov5

关键依赖安装顺序很重要：

先装PyTorch（建议1.7.1版本）

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch

再装其他依赖

pip install opencv-python matplotlib pandas tqdm seaborn

克隆YOLOv5官方仓库时，推荐用国内镜像加速：

git clone https://gitee.com/mirrors/YOLOv5.git cd yolov5 pip install -r requirements.txt

注意：如果遇到SSL证书错误，可以尝试在pip命令后加--trusted-host pypi.org --trusted-host files.pythonhosted.org

2. 数据准备：高效标注人脸数据集

我用过三种标注工具，最终发现LabelImg最适合新手。安装很简单：

pip install labelImg labelImg

打开软件后记得设置两点：

右下角选择YOLO格式
保存目录选labels文件夹

标注技巧：

框选时尽量贴近人脸边缘
遇到侧脸时以可见面部区域为准
遮挡超过50%的人脸建议不标注

数据集划分我建议按7:2:1的比例：

训练集：70%
验证集：20%
测试集：10%

目录结构示例：

CASIA-FaceV5/ ├── images │ ├── train │ ├── val │ └── test └── labels ├── train ├── val └── test

3. 模型配置：定制化YOLOv5s网络

在yolov5/models目录下复制yolov5s.yaml，重命名为face.yaml。只需修改两个参数：

nc: 1 # 只有人脸一个类别 names: ['face'] # 类别名称

数据配置文件（data/face.yaml）示例：

train: ../CASIA-FaceV5/images/train val: ../CASIA-FaceV5/images/val nc: 1 names: ['face']

训练参数建议：

小显存（6GB以下）：batch-size设为8-12
中等显存（8GB）：batch-size 16-24
大显存：可以尝试32

4. 模型训练：从预训练模型迁移学习

启动训练的命令详解：

python train.py \ --data data/face.yaml \ --cfg models/face.yaml \ --weights yolov5s.pt \ --epochs 100 \ --batch-size 16 \ --img-size 640 \ --device 0 # 使用第一块GPU

训练过程常见问题：

Loss不下降：检查学习率（默认0.01可能太大）
CUDA内存不足：减小batch-size
验证集mAP低：检查标注质量

实时监控训练进度：

tensorboard --logdir runs/train

5. 模型验证与测试

验证模型性能：

python val.py \ --data data/face.yaml \ --weights runs/train/exp/weights/best.pt \ --batch-size 8 \ --task test # 在测试集上验证

测试单张图片：

python detect.py \ --weights runs/train/exp/weights/best.pt \ --source test.jpg \ --conf 0.5 # 置信度阈值

6. 实时人脸检测部署

摄像头实时检测命令：

python detect.py \ --weights best.pt \ --source 0 \ # 0表示默认摄像头 --view-img \ # 实时显示窗口 --conf-thres 0.6 # 调高阈值减少误检

性能优化技巧：

添加--half参数使用半精度推理
使用TensorRT加速（需导出ONNX）
对于多摄像头，可以用--source rtsp://url

7. 常见问题解决方案

检测框闪烁问题：

使用ByteTrack等跟踪算法
在detect.py中添加帧间缓存

小脸检测效果差：

修改model.yaml中的anchor尺寸
数据增强中添加更多小脸样本

侧脸漏检：

增加侧脸训练数据
调整非极大抑制参数iou-thres

最后分享一个实用技巧：在detect.py中添加以下代码可以保存检测结果：

if save_img: cv2.imwrite(save_path, im0)

查看全文

http://www.jsqmd.com/news/1088645/

Selenium自动化测试中JavaScript的六大实战应用与性能优化

UML九图实战指南：从理论到项目落地

Software 2.0：数据即源码、训练即编译的范式革命

从零到一：手把手搭建TIGRE医学影像GPU重建开发环境（Matlab+CUDA+VS）

【操作系统】前趋图与PV操作（结合前趋图解题）

Unlimiformer：突破Transformer长文本处理瓶颈的动态注意力机制

软件工程核心实践：从面向对象到测试维护的实战解析

在 Azure AI Search 中查询同一组关键词时，经常会遇到一个现象：searchMode=any 返回很多结果，改成 searchMode=all 后结果数量明显下降，甚至只剩很少几条。

AI助力关键词管理的SEO优化新思路

纯JavaScript实现RSA加密库：从大数运算到PKCS#1填充

Early Stopping原理与实战：避免过拟合的关键训练干预机制

Claude Code Security：AI驱动的代码审计与漏洞挖掘实战指南

BetterNCM Installer：5分钟掌握Windows网易云插件自动化安装的终极方案

N_m3u8DL-RE：三个场景告诉你为什么需要现代流媒体下载工具

Gemini Study Notebooks 是什么：Google 把 AI 学习笔记做成了什么样

终极指南：如何使用VMPDump高效破解VMProtect 3.x保护 - 完整动态脱壳教程

大漠插件实战入门：从零到一的自动化脚本插件注册指南

软考补贴申领全流程拆解（从报名到打款仅需17天！）：含人社局内部审核逻辑与材料预审自查表

5分钟快速上手：让Switch手柄在PC上完美工作的BetterJoy终极指南

终极Wallpaper Engine资源提取解决方案：RePKG完全指南

如何免费解锁网易云加密音乐：NCMDump终极转换指南

Java流程引擎CompileFlow测试实战：从单元到性能的完整方案

Red Panda Dev-C++：零配置的现代化C++开发环境终极指南

ROS软路由安全加固：从默认漏洞到进阶防护的5大实战要点

基于双层优化的微电网系统规划设计方法（Matlab代码实现）

如何用TlbbGmTool轻松管理游戏数据？这个强力工具让你告别繁琐操作

CCC数字钥匙的UWB PHY：从IEEE标准到汽车场景的定制化实现

基于HarmonyOS 7.0 跨端开发的读书金句收藏页面实战

嵌入式音视频技术深度解析：从比特到像素的硬核之旅

路径遍历漏洞攻防实战：从原理到多层次防御体系构建