当前位置：首页 > news >正文

利用DdddOCR自建API，为YesCaptcha插件打造免费离线验证码识别引擎

news 2026/7/9 3:56:42

1. 为什么需要自建验证码识别API

验证码识别是很多自动化工具的核心功能，但市面上大多数解决方案要么收费昂贵，要么识别率不稳定。YesCaptcha插件虽然提供了便捷的浏览器集成，但其官方API需要按次付费，长期使用成本不低。这时候，开源的DdddOCR就成为了一个绝佳的替代方案。

我最近在开发一个自动化项目时，发现验证码识别这块的成本占了整体预算的30%以上。官方API每千次调用就要几十块钱，对于高频使用的场景来说实在吃不消。经过多次测试对比，我发现DdddOCR这个开源库在常见验证码类型的识别上表现相当不错，特别是数字和英文字母组合的验证码，准确率能达到90%以上。

2. DdddOCR的优势与局限

DdddOCR最大的优势就是完全开源免费，而且支持离线使用。这意味着我们不需要依赖任何第三方服务，也不用担心隐私数据外泄。它的识别模型经过大量数据训练，对常见的扭曲、干扰线、背景噪声都有不错的抗干扰能力。

不过也要客观地说，DdddOCR并不是万能的。根据我的实测经验，它在处理以下情况时表现会打折扣：

中文字符验证码（特别是手写体）
极度扭曲变形的字符
复杂背景下的验证码
需要逻辑推理的验证码（如点击图中某类物体）

3. 搭建Flask API服务

3.1 环境准备

首先确保你的开发环境已经安装Python 3.6+。我推荐使用虚拟环境来管理依赖：

python -m venv venv source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows

然后安装必要的依赖包：

pip install flask ddddocr

3.2 核心代码实现

创建一个server.py文件，写入以下代码：

from flask import Flask, request, jsonify from urllib.parse import unquote import ddddocr import base64 import json import uuid app = Flask(__name__) ocr = ddddocr.DdddOcr(show_ad=False) # 禁用广告显示 @app.route('/createTask', methods=['POST']) def recognize_captcha(): task_id = str(uuid.uuid4()) try: # 解析请求数据 request_data = json.loads(unquote(request.get_data())) image_data = request_data['task']['body'] # 清理base64前缀 if image_data.startswith('data:image'): image_data = image_data.split(',', 1)[1] # 解码图片 decoded_bytes = base64.b64decode(image_data) # 识别验证码 result = ocr.classification(decoded_bytes) # 返回标准格式响应 return jsonify({ 'errorId': 0, 'errorCode': '', 'status': 'ready', 'solution': {'text': result}, 'taskId': task_id }), 200 except Exception as e: return jsonify({ 'errorId': 2, 'errorCode': str(e), 'status': 'error', 'solution': {}, 'taskId': task_id }), 500 if __name__ == '__main__': app.run(host='0.0.0.0', port=5000, debug=False)

这段代码实现了YesCaptcha插件所需的API接口规范。关键点在于：

使用Flask创建Web服务
按照YesCaptcha的文档要求处理请求和响应格式
通过DdddOCR进行实际的验证码识别

3.3 服务部署与优化

启动服务很简单：

python server.py

但在生产环境中，我建议使用更专业的WSGI服务器，比如Gunicorn：

pip install gunicorn gunicorn -w 4 -b 0.0.0.0:5000 server:app

为了提高性能，可以考虑以下优化措施：

启用OCR模型的缓存
增加请求超时处理
添加基础的API认证
实现请求频率限制

4. 配置YesCaptcha插件

服务运行起来后，需要在YesCaptcha插件中配置我们的自建API地址：

点击浏览器右上角的YesCaptcha插件图标
选择"设置"选项
在"API地址"栏输入http://你的服务器IP:5000/createTask
保存设置

现在插件就会将验证码识别请求发送到你自己的服务器，而不是官方API了。我在Chrome和Firefox上都测试过，配置过程完全一致。

5. 实际使用技巧

经过一段时间的实际使用，我总结出几个提高识别率的技巧：

图片预处理：在将图片传给DdddOCR之前，可以先进行一些简单的处理，比如二值化、降噪等。虽然DdddOCR内置了一些预处理逻辑，但针对特定类型的验证码，额外的处理能显著提高准确率。
多模型组合：DdddOCR实际上提供了多个模型，针对不同类型的验证码可以选用不同的模型。比如对于纯数字验证码，可以使用专门优化的数字识别模型。
结果校验：对于关键操作，可以增加简单的校验逻辑。比如知道验证码应该是6位数字，但识别结果却是5位，就可以自动重试。
日志记录：建议记录识别失败的案例，用于后续分析和模型优化。我在服务器上添加了一个简单的日志系统，把识别错误的验证码图片和错误结果都保存下来，定期分析这些案例有助于理解模型的弱点。