当前位置：首页 > news >正文

毕业设计人工智能项目从0到1：新手避坑指南与可落地技术选型

news 2026/3/27 4:36:21

毕业设计人工智能项目从0到1：新手避坑指南与可落地技术选型

摘要：很多计算机专业的同学第一次做 AI 毕设，都会卡在“代码能跑，但一部署就崩”。本文把我自己踩过的坑整理成一份“新手地图”，从选题、训练到上线一条线讲清，并给出可直接复用的 PyTorch→ONNX→Flask 模板。只要跟着做完，你就能在 4 G 显存的笔记本上跑通图像分类，还能把模型塞进 Web 服务，让答辩老师现场拍照识别，稳稳过关。

1. 背景痛点：为什么 AI 毕设总翻车？

数据不足：
网上爬了两千张图，结果每类不到 300 张，训练 loss 像过山车，验证 acc 直接躺平。
GPU 资源匮乏：
实验室显卡被学长 24 h 占满，自己笔记本只有 MX450，跑 ResNet50 一轮要 3 小时。
模型无法部署：
本地.pth文件 90 M，放到服务器上内存直接爆掉，老师一句“能在手机上看效果吗？”瞬间社死。

一句话：学术代码 ≠ 工程代码，毕设不仅要“跑通”，更要“落地”。

2. 技术选型：PyTorch vs TFLite vs ONNX 谁更适合你？

维度	PyTorch	TensorFlow Lite	ONNX Runtime
开发体验	动态图友好，Debug 直观	静态图，API 略绕	纯推理，训练需转模型
训练资源	吃显存，需 CUDA	训练完转`.tflite`即可	不负责训练
部署体积	原始模型大	量化后 1/4 大小	与原始框架相关
移动端	需 LibTorch，体积 40 M+	官方支持，Android/iOS 一键	需 ONNX Runtime Mobile
代码量	中	多（Graph、量化）	少（仅推理）

结论

笔记本训练 → PyTorch 最快；
手机端演示 → TFLite 最轻；
既要又要 → 训练用 PyTorch，导出 ONNX，再用 ONNX Runtime 写后端，体积与速度兼得。

下面以“笔记本训练 + Web 演示”为例，给出完整流程。

3. 核心实现：30 行训练 + 20 行推理模板

场景：猫狗二分类，数据集kaggle cats_vs_dogs，笔记本 4 G 显存，目标：训练 10 min 内完成，模型大小 < 30 M。

3.1 环境隔离（先别急着`pip install`）

# 建虚拟环境，Python 3.9 兼容性最好 python -m venv venv_ai source venv_ai/bin/activate # 依赖一次性锁死，后面换电脑也能复现 pip install torch==2.0.1+cu118 torchvision pandas flask onnxruntime-gpu -i https://download.pytorch.org/whl/cu118 pip freeze > requirements.txt

3.2 数据预处理：统一 224×224，实时增强

# data.py from torchvision import transforms train_tf = transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) val_tf = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ])

经验：训练集加RandomFlip，验证集不要任何随机，保证结果可复现。

3.3 模型定义：MobileNetV3 轻量 backbone

# model.py import torch.nn as nn from torchvision.models import mobilenet_v3_large class CatDogNet(nn.Module): def __init__(self, num_classes=2): super.__init__() self.backbone = mobilenet_v3_large(pretrained=True) self.backbone.classifier[-1] = nn.Linear(1280, num_classes) def forward(self, x): return self.backbone(x)

只改最后一层，其余冻结可省显存，但毕设时间紧，直接全量微调最快。

3.4 训练脚本：10 行核心循环

# train.py from torch.cuda.amp import GradScaler, autocast model = CatDogNet().cuda() opt = torch.optim.AdamW(model.parameters(), lr=3e-4) scaler = GradScaler() for epoch in range(5): # 5 轮先跑通 for x, y in train_loader: opt.zero_grad() with autocast(): # 混合精度省显存 out = model(x.cuda()) loss = nn.CrossEntropyLoss()(out, y.cuda()) scaler.scale(loss).backward() scaler.step(opt) scaler.update() torch.save(model.state_dict(), f'epoch_{epoch}.pth')

技巧：
用autocast几乎不掉点，显存减半；
每轮存ckpt，崩了能从最近一轮恢复。

3.5 导出 ONNX：一条命令

# export_onnx.py dummy = torch.randn(1, 3, 224, 224).cuda() torch.onnx.export(model, dummy, "catdog.onnx", input_names=['img'], output_names=['logits'], dynamic_axes={'img': {0: 'batch'}, 'logits': {0: 'batch'}})

动态 batch 方便后面一次传多张图。

3.6 Flask 简易 API：20 行搞定

# app.py from flask import Flask, request, jsonify import onnxruntime as ort from PIL import Image import numpy as np, io app = Flask(__name__) ort_sess = ort.InferenceSession("catdog.onnx", providers=['CUDAExecutionProvider']) def preprocess(image_bytes): img = Image.open(io.BytesIO(image_bytes)).convert('RGB') img = val_tf(img).unsqueeze(0).numpy() return img @app.route("/predict", methods=["POST"]) def predict(): x = preprocess(request.files['img'].read()) logits = ort_sess.run(None, {'img': x})[0] prob = float(np.exp(logits[:,1]) / (np.exp(logits[:,1]) + np.exp(logits[:,0]))) return jsonify({"dog_prob": round(prob, 3)}) if __name__ == "__main__": app.run(host="0.0.0.0", port=5000)

启动服务：python app.py，局域网手机访问http://电脑IP:5000/predict即可实时识别。

4. 性能与安全：别让模型一上线就“躺平”

冷启动延迟：
ONNX Runtime 首次加载要编译 CUDA kernel，可提前warmup：在app.py里加一句ort_sess.run(...)用全零数组跑一遍，用户请求来时延迟从 2 s 降到 200 ms。
输入校验缺失风险：
直接Image.open遇到非图片字节会 500，需捕获异常并返回 400；
对上传尺寸做限制，防止 10000×10000 大图把内存撑爆。
模型版本管理：
把catdog.onnx重命名带时间戳，如catdog_20240517_v1.onnx，Flask 启动参数传入，回滚只需改文件名。

5. 生产环境避坑清单

虚拟环境隔离：
永远不要在系统 Python 里sudo pip，用venv或conda保证可迁移。
依赖锁定：
pip freeze > requirements.txt后，加--hash校验更稳；如果团队多人，直接上poetry.lock。
日志与监控：
Flask 默认单线程，并发一高就阻塞，用gunicorn -w 4 -b 0.0.0.0:5000 app:app起 4 进程；
日志落盘，方便复现线上 badcase。
模型加密：
ONNX 明文权重，商业交付可开onnxruntime.Encryption，毕业答辩可跳过，但心里要有数。

6. 拓展思考：如何把模型塞进手机？

量化：
PyTorch → ONNX 后，用onnxruntime_tools做静态量化，权重从 FP32 压到 INT8，体积再砍一半。
转 TFLite：
把 ONNX 先回tf.saved_model，再用TFLiteConverter量化，最后得到model.tflite，Android Studio 直接引用。
端侧 Demo：
官方示例TFLite Classification Sample改两行标签即可，拍照→预处理→推理→显示，全程离线，答辩现场断网也不怕。