当前位置：首页 > news >正文

车牌识别系统毕业设计实战：从模型选型到部署优化的全流程解析

news 2026/7/10 1:26:19

1. 背景痛点：为什么“跑通 demo”≠“能毕业”

做车牌识别毕设，90% 的同学都会踩到这三颗雷：

识别精度“看天吃饭”：手机拍一张还行，监控抓拍就全错；晴天 95%，雨天 60%。
环境依赖“玄学”：今天 pip install 能跑，明天换台机器就缺 .so；导师一编译就报错。
代码“一次性”：jupyter 里调通就敢写论文，结果答辩现场换图就翻车，复现全靠运气。

归根结底，是把“算法”当成“系统”。毕业设计要的是可复现、可迁移、可演示的完整工程，而不仅仅是准确率数字。

2. 技术选型：传统视觉 vs 深度学习

先给结论：

只想两周交差，用 OpenCV 传统方法；
想真刀真枪上线，用 YOLOv5-Lite + CRNN，再量化蒸馏。

维度	Sobel+形态学	YOLOv5-Lite+CRNN
精度	75%±10（光照敏感）	93%±2（鲁棒）
速度（i5-10400）	30 ms	45 ms（FP16）
依赖	仅 OpenCV	PyTorch+torchvision
部署难度	极低	需转 ONNX+量化
扩展性	几乎 0	换数据即可微调

传统方案最大优点是零 GPU，但遇到污损车牌、新能源绿牌直接跪；深度学习一次性痛苦，换来的是真·工业级可用。

3. 核心实现：四步流水线，彻底解耦

把系统拆成 4 个独立模块，每个都做成“黑盒”，方便单元测试与后续升级。

3.1 车牌检测（YOLOv5-Lite）

输入：原始图像 BGR uint8
输出：车牌四点坐标 [(x1,y1)…(x4,y4)]
关键 trick：
1. 训练时做随机透视变换，模拟斜拍；
2. 使用SIoU Loss，倾斜框收敛更快；
3. 推理后做NMS+置信度≥0.5过滤，减少误检。

3.2 几何矫正（Perspective Transform）

用 cv2.getPerspectiveTransform 把四点映射到 280×80 矩形；
边缘留白 4 像素，防止后续字符贴边；
保存矫正矩阵，方便在可视化阶段画回原图。

3.3 字符分割（可选）

蓝牌/黄牌可做“投影法”粗分，新能源绿牌建议跳过；
若分割，用自适应阈值 + 垂直投影，对峰值做非极大抑制；
输出按左→右排序的字符图块列表，供识别模型 batch 推理。

3.4 字符识别（CRNN）

网络：ResNet18 骨干 + 2 层 BiLSTM + CTC Loss；
中文字典：31 省市简称 + 0-9 + A-Z（去除 O/I）；共 68 类；
训练技巧：
1. 合成数据用TextRenderer，字体、模糊、光照全拉满；
2. 真实数据用LabelImg-Auto，检测框直接转字符框，人工只改错；
3. 蒸馏：教师模型 BiLSTM 隐藏层 256→学生 128，提速 30% 不掉点。

4. 代码示例：最小可运行版本

以下代码遵循 Clean Code 原则：函数≤20 行、无魔法数、提前 return。

说明：为控制篇幅，只贴核心片段，完整仓库见文末 GitHub 链接。

4.1 检测器封装

# detector.py import cv2, torch, numpy as np, onnxruntime as ort class PlateDetector: def __init__(self, onnx_path, conf_thres=0.5, nms_thres=0.4): self.ort_sess = ort.InferenceSession(onnx_path) self.conf_thres = conf_thres self.nms_thres = nms_thres def __call__(self, img_bgr): """return list of quadrangles""" tensor = self.preprocess(img_bgr) # 1×3×640×640 outputs = self.ort_sess.run(None, {self.ort_sess.get_inputs()[0].name: tensor}) boxes = self.postprocess(outputs) # N×4×2 return boxes def preprocess(self, img_bgr): img = cv2.resize(img_bgr, (640, 640)) img = img[:, :, ::-1].transpose(2, 0, 1) # BGR→RGB img = np.ascontiguousarray(img / 255, dtype=np.float32) return img[None] def postprocess(self, outputs): # outputs: [pred,] pred = torch.tensor(outputs[0]) pred = pred[pred[..., 4] > self.conf_thres] boxes = self.xywha2quad(pred) keep = cv2.dnn.NMSBoxesRotated( [cv2.RotatedRect(*b) for b in boxes], scores=pred[..., 4].tolist(), score_threshold=self.conf_thres, nms_threshold=self.nms_thres) return [boxes[i] for i in keep]

4.2 识别器封装

# recognizer.py import torch, string from torch.nn import CTCLoss class PlateRecognizer: CHARS = "-京沪津渝冀晋蒙辽吉黑苏浙皖闽赣鲁豫鄂湘粤桂琼川贵云藏陕甘青宁新" \ + string.digits + string.ascii_uppercase.replace("O", "") def __init__(self, weights): self.model = torch.jit.load(weights).eval() # 已量化到 int8 self.converter = CTCLabelConverter(self.CHARS) def __call__(self, plate_img): """plate_img: 280×80 uint8""" tensor = self.preprocess(plate_img) # 1×1×32×128 logits = self.model(tensor) # T×1×68 text = self.converter.decode(logits) return text def preprocess(self, img): img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img = cv2.resize(img, (128, 32)) img = img.astype(np.float32) / 255.0 return torch.tensor(img[None, None])

4.3 Flask API 一键启动

# app.py from flask import Flask, request, jsonify from detector import PlateDetector from recognizer import PlateRecognizer app = Flask(__name__) det = PlateDetector("plate.onnx") rec = PlateRecognizer("crnn_int8.pt") @app.route("/plate", methods=["POST"]) def predict(): file = request.files["image"] img = cv2.imdecode(np.frombuffer(file.read(), np.uint8), cv2.IMREAD_COLOR) boxes = det(img) results = [] for pts in boxes: plate = four_point_transform(img, pts) # 矫正 text = rec(plate) results.append({"number": text, "pts": pts.tolist()}) return jsonify(results) if __name__ == "__main__": app.run(host="0.0.0.0", port=8080)

Dockerfile 两行即可打包：

FROM python:3.9-slim COPY . /app RUN pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple CMD ["gunicorn", "-w", "2", "-b", "0.0.0.0:8080", "app:app"]

5. 性能与安全：让导师挑不出刺

推理延迟
- 单张 1080p 全流程 55 ms（i5-10400+OpenVINO），满足 15 fps；
- 批量推理：把同一帧多车牌拼 batch，CRNN 用 1×N 横向堆叠，GPU 利用率↑30%。
内存占用
- ONNX+int8 量化后，模型体积 1.9 MB→0.6 MB；
- Flask 单 worker 常驻 180 MB，开 2 worker 足够 4 路并发。
输入校验
- 限制上传尺寸≤2000×2000，防 OOM；
- 白名单校验 Content-Type=image/jpeg/png；
- 用 Pillow 打开再转 CV2，阻断畸形图片触发 libjpeg 漏洞。
防注入
- 禁止用户传路径，文件统一 uuid 命名；
- 返回 JSON 时设置 Content-Disposition: inline，防止 XSS 嵌图片。

6. 生产环境避坑指南

模型量化：
PyTorch→ONNX→ONNXRuntime 动态量化，CRNN 的 LSTM 层需设置opset_version=11，否则报错。
路径硬编码：
用pathlib.Path(__file__).resolve().with_name("weights")，Windows 与 Linux 通用。
中文字符集：
字典顺序必须与训练时一致，建议把字典写进config.yaml，推理端直接读取，避免“粤”变“奥”。
GPU 冷启动：
torch 1.13 首次 CUDA 初始化 2-3 s，可把model.cuda()放在 DockerENTRYPOINT阶段，用户请求来时再预热一次空推理。
多车牌漏检：
训练时把“整图无车牌”作为负样本加入，置信度阈值可降到 0.3，再二次 NMS，减少重叠。