给你一套最简单、最稳定、不踩坑的标准流程,直接跟着做就能用
一、创建项目(标准结构)
1. 新建项目文件夹
my_ocr_project/ ├── .venv/ # 虚拟环境(自动生成) ├── src/ # 代码目录 │ ├── __init__.py │ ├── ocr.py # 你的OCR主逻辑 │ └── utils.py # 工具函数 ├── requirements.txt # 依赖版本锁(最重要) ├── .gitignore # 忽略不需要提交的文件 ├── main.py # 项目入口
二、创建虚拟环境(必须!)
Windows
python -m venv .venv
.venv\Scripts\activate
Linux/Mac
python3 -m venv .venv
source .venv/bin/activate
激活后,前面会出现 (.venv)
三、依赖管理(最重要!固定版本)
1. 创建 requirements.txt
# 核心框架 paddlepaddle==3.0.0 paddleocr==2.9.1# 图像处理 opencv-python-headless==4.10.0.84 pymupdf==1.27.2 numpy==1.26.4 pillow==10.4.0
2. 安装依赖
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
3. 导出当前环境所有依赖
pip freeze > requirements.txt
这样能保证:本地、服务器、Docker 环境完全一致!
四、项目入口文件:main.py
from src.ocr import run_ocrif __name__ == "__main__":result = run_ocr("test.jpg")for text in result:(text)
五、Git 版本管理
1. 创建 .gitignore
.venv/ __pycache__/ *.pyc *.pyo *.pyd *.log *.jpg *.png *.pdf models/ build/ dist/ *.egg-info/
2. 初始化 Git
git init git add . git commit -m "init: paddleocr project"
3. 查看版本
git log
六、项目运行
python main.py
