当前位置：首页 > news >正文

拍摄发票照片，自动识别发票金额，开票日期，商家名称，提取关键信息，生成电子记账表。

news 2026/7/3 7:21:31

1. 实际应用场景描述

在个人理财、企业报销、税务管理等领域，我们每天都会收到各种发票（纸质或电子图片）。

- 个人记账时，需要手动输入发票上的金额、日期、商家名称，费时费力。

- 企业财务需要批量处理大量发票，人工录入容易出错。

- 纸质发票不易保存，查找困难。

如果有一个智能程序，只需拍摄发票照片，就能自动识别关键信息并生成电子记账表，将极大提升效率，减少人为错误。

2. 痛点分析

1. 手动录入繁琐：每张发票都要逐字段输入。

2. 易出错：数字、日期格式不统一，容易录错。

3. 查找困难：纸质发票不易分类存储。

4. 批量处理难：企业财务面对大量发票时效率低下。

3. 核心逻辑讲解

3.1 图像预处理

- 对拍摄的发票照片进行灰度化、二值化、去噪等操作，提高 OCR 识别率。

- 可使用 OpenCV 进行边缘检测和倾斜校正。

3.2 OCR 文字识别

- 使用

"pytesseract"（Tesseract OCR 的 Python 封装）识别图片中的文字。

- 支持中文识别（需安装中文语言包）。

3.3 关键信息提取

- 使用规则匹配或正则表达式提取金额（如“￥123.45”）、日期（如“2024-12-31”）、商家名称（通常在发票顶部）。

- 可升级为 NLP 实体识别模型（如 BERT）提高准确率。

3.4 数据存储

- 将提取的信息存入 CSV 文件，形成电子记账表。

- 可扩展为 SQLite 或 Excel 文件。

4. 模块化代码（Python）

# invoice_ocr.py

import cv2

import pytesseract

import re

import csv

from datetime import datetime

class InvoiceOCR:

def __init__(self, output_csv='invoice_records.csv'):

self.output_csv = output_csv

# 初始化 CSV 文件

with open(self.output_csv, 'w', newline='', encoding='utf-8-sig') as f:

writer = csv.writer(f)

writer.writerow(['商家名称', '开票日期', '金额(元)', '识别时间'])

def preprocess_image(self, image_path):

"""图像预处理：灰度化、二值化、去噪"""

img = cv2.imread(image_path)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

_, thresh = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

denoised = cv2.medianBlur(thresh, 3)

return denoised

def ocr_image(self, image_path):

"""OCR 识别文字"""

processed_img = self.preprocess_image(image_path)

text = pytesseract.image_to_string(processed_img, lang='chi_sim+eng')

return text

def extract_info(self, text):

"""提取商家名称、日期、金额"""

# 商家名称：假设在文本前几行

lines = text.split('\n')

merchant = lines[0].strip() if lines else ''

# 日期：匹配 YYYY-MM-DD 或 YYYY/MM/DD

date_pattern = r'\d{4}[-/]\d{1,2}[-/]\d{1,2}'

date_match = re.search(date_pattern, text)

date = date_match.group() if date_match else ''

# 金额：匹配￥123.45 或 123.45元

amount_pattern = r'[￥¥]?\s*\d+\.\d{2}\s*[元]?'

amount_match = re.search(amount_pattern, text)

amount = amount_match.group().replace('￥', '').replace('¥', '').replace('元', '').strip() if amount_match else ''

return merchant, date, amount

def save_to_csv(self, merchant, date, amount):

"""保存到 CSV"""

with open(self.output_csv, 'a', newline='', encoding='utf-8-sig') as f:

writer = csv.writer(f)

writer.writerow([merchant, date, amount, datetime.now().strftime('%Y-%m-%d %H:%M:%S')])

def process_invoice(self, image_path):

"""处理单张发票"""

print("正在识别发票...")

text = self.ocr_image(image_path)

print("识别文本：\n", text)

merchant, date, amount = self.extract_info(text)

print(f"商家：{merchant}, 日期：{date}, 金额：{amount}")

self.save_to_csv(merchant, date, amount)

print("已保存到电子记账表。")

def main():

ocr = InvoiceOCR()

image_path = input("请输入发票照片路径：").strip()

ocr.process_invoice(image_path)

if __name__ == "__main__":

main()

5. README 文件

# 发票自动识别与电子记账工具

基于 Python + OpenCV + Tesseract OCR，实现拍摄发票照片自动识别金额、日期、商家名称，并生成电子记账表。

## 功能

- 发票照片预处理

- OCR 文字识别（支持中英文）

- 关键信息提取

- 自动保存到 CSV 记账表

## 安装依赖

bash

pip install opencv-python pytesseract

> 需安装 [Tesseract OCR](https://github.com/tesseract-ocr/tesseract) 及中文语言包。

## 使用

bash

python invoice_ocr.py

输入发票照片路径，程序会自动识别并保存。

## 示例

输入照片路径后，输出：

商家：星巴克咖啡, 日期：2024-12-31, 金额：36.50

已保存到电子记账表。

6. 使用说明

1. 安装 Tesseract OCR 及中文语言包。

2. 安装 Python 依赖。

3. 运行脚本，输入发票照片路径。

4. 程序会识别并保存信息到

"invoice_records.csv"。

5. 可用 Excel 打开 CSV 查看记账表。

7. 核心知识点卡片

知识点说明

OCR 技术使用 Tesseract 将图像转为文本

图像预处理灰度化、二值化、去噪提高识别率

正则表达式提取金额、日期等结构化信息

CSV 操作将数据持久化存储

可扩展性可升级为 NLP 模型或接入财务系统

8. 总结

本项目展示了如何用 Python + OpenCV + Tesseract OCR + 规则提取快速实现一个发票自动识别与电子记账工具，解决了手动录入发票信息的痛点。

- 优点：自动化程度高、可批量处理、易于集成。

- 未来可引入深度学习 OCR 模型（如 PaddleOCR、TrOCR）和 NLP 实体识别，提升复杂版式发票的识别准确率，并支持导出 Excel、对接财务软件。

- 适合作为 AI 方法与技术课程的实践案例，涵盖图像处理、文本识别、数据提取与存储全流程。

如果你愿意，可以升级为 PaddleOCR 版本，并增加批量处理和 GUI 界面，让它更适合实际财务工作。

利用AI高效解决实际问题，如果你觉得这个工具好用，欢迎关注我！

查看全文

http://www.jsqmd.com/news/284373/

2026年大模型就业全景：技术演进、核心技能与职业发展指南

学术会议资料管理与共享平台开题报告

智能会议系统集成生产厂哪家售后给力，优质厂家大汇总

【基于无人机搭载相机网络的交互式监控分布式方法】基于无人机搭载摄像头网络的交互式监控分布式方法研究附Matlab代码

学历普通也能找到高薪！CSDN博主教你：用网络安全打破“双非”魔咒，锁定高薪offer！

收藏备用！SFT/ReFT/RLHF/DPO/PPO五大大模型微调技术全解析+对比

GPT-5.2-Pro与Sora 2强强联手：底层架构深度解析与企业级API低成本接入实战（附全套Python源码）

盘点2026年工业记录仪品牌，杭州美控稳定性强排名靠前

从学生建言到省厅红头文件：一个普通大学生的产业政策“漂流记”

收藏！985程序员弃考公选企业，5年中层年薪30万，大模型才是破局关键

2025年12月威胁情报：供应链攻击与恶意软件分析

【计算机视觉、关键点检测、特征提取和匹配】基于SIFT、PCA-SIFT和GLOH算法在不同图像之间建立特征对应关系，并实现点匹配算法和图像匹配附Matlab代码

几十个人的3D设计团队如何提升SolidWorks、catia、ug等三维设计软件的利用率

企业私有化部署首选，MonkeyCode 安全适配本地模型

【CNN+DOA】告别繁琐实验！这款DOA估计框架，一键对比深度学习与传统算法【附python代码】

必学收藏！12个大模型Agent实战应用案例：从电影生成到金融分析的完整指南

杭州中小工厂展览会举办时间、报名方式及展会持续多久全揭秘

深度收藏：RAG架构革命 - 解决大模型幻觉与知识瓶颈的终极方案

‌职业倦怠自救：2026年软件测试从业者心理健康管理指南

收藏！大模型岗位薪资真相曝光，程序员/小白必看的职业启示

【基于STFT-CNN-LSTM的故障诊断】基于短时傅里叶变换（STFT）、卷积神经网络（CNN）与长短期记忆网络（LSTM）的混合故障诊断模型（STFT-CNN-LSTM）研究附Matlab代码

【基于STFT-CNN-SVM的故障诊断】一种融合短时傅里叶变换（STFT）、卷积神经网络（CNN）和支持向量机（SVM）的故障诊断研究附Matlab代码

收藏备用！2026顶流AI Agent全解析：程序员必懂的概念、区别与落地案例

收藏！人均收入数据背后，2026年AI风口下普通人可入局的高薪岗位

如何用开源项目打造你的2026职业护城河？——软件测试从业者的进阶指南

【基于STFT-CNN的故障诊断】基于短时傅里叶变换（STFT）与卷积神经网络（CNN）的故障诊断研究附Matlab代码

【深度学习】YOLO论文官方演进 + 目标检测经典 + 拓展创新

【值得收藏】深入浅出大模型工作原理：从文本输入到语言生成的技术解析

北京蔡司小乐圆配镜老牌公司推荐，看哪家产品价格实惠？

相关文章：