当前位置: 首页 > news >正文

抖音豆包九宫格验证码识别

一、简介

上图是抖音九宫格验证码图片的样例图片。这款验证码确实有很大的难度,有一下几个特点:

1、首先是图片种类非常多。

2、其次图片都是由AI随机生成,每一张图片都不一样。

3、还需要结合语义进行理解

二、识别准备

经过我们几个月的研究,终于完成了这款识别模型的开发,正确率能达到90%以上,并且我们还会持续更新,争取达到100%的正确率。

识别这个图片需要上传两个东西:

1、九宫格原图

目前不支持截图,原图是通过图片链接下载的图片,是这种直接拼接的图片,不像页面显示的有变色间隔。

2、点击描述文本

描述文本页面上显示的是什么,就需要传什么。不能修改,不能自定义描述,也不能去掉原本的标点符号。

三、识别代码

下面是使用python写的识别样例代码

import base64 import requests import datetime from io import BytesIO from PIL import Image, ImageDraw t1 = datetime.datetime.now() #PIL图片保存为base64编码 def PIL_base64(img, coding='utf-8'): img_format = img.format if img_format == None: img_format = 'JPEG' format_str = 'JPEG' if 'png' == img_format.lower(): format_str = 'PNG' if 'gif' == img_format.lower(): format_str = 'gif' if img.mode == "P": img = img.convert('RGB') if img.mode == "RGBA": format_str = 'PNG' img_format = 'PNG' output_buffer = BytesIO() # img.save(output_buffer, format=format_str) img.save(output_buffer, quality=100, format=format_str) byte_data = output_buffer.getvalue() base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding) # base64_str = base64.b64encode(byte_data).decode(coding) return base64_str # 加载图片 img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\86.jpg') # 图片转base64 img1_base64 = PIL_base64(img1) 得塔云地址 http://bq1gpmr8.xiaomy.net(电信) http://220.167.181.200:9009(移动、电信、联通) 根据不同网络选择不同接口 # 验证码识别接口 url = "http://bq1gpmr8.xiaomy.net/openapi/verify_code_identify/" data = { # 用户的key "key":"2zLW3AnTbYJaEV4ofH3G", # 验证码类型 "verify_idf_id":"86", # 样例图片 "img_base64":img1_base64, # 点击的物品名称 "words": "有哪些生态元素可以在森林中看到?", } header = {"Content-Type": "application/json"} # 发送请求调用接口 response = requests.post(url=url, json=data, headers=header) point_list = eval(response.json()['data']['res_str']) # 获取响应数据,识别结果 print(response.text) print("耗时:", datetime.datetime.now() - t1) img1 = img1.convert("RGB") draw = ImageDraw.Draw(img1) point_list = [(x[0] - 5, x[1] - 5, x[0] + 5, x[1] + 5) for x in point_list] for point in point_list: draw.ellipse(point, fill=(255, 0, 0)) # 显示识别后标记的点击点 img1.show()

运行上面代码,用红色圆点标注出了需要点击的图片,如下图

想了解更多验证码识别请访问:http://bq1gpmr8.xiaomy.net/tool/verifyCodeHomePage2/?_=1771917979926

http://www.jsqmd.com/news/491768/

相关文章:

  • 当钢铁有了灵魂:寻找那些最懂“交互叙事”的机械装置造梦者
  • 2026年高净值男性私密健康报告!肾虚阳痿吃什么好?精英人群补肾产品推荐TOP10,稳坐首位 - 资讯焦点
  • 【MySQL-索引调优】02:单列索引
  • 企微机器人开发:实现私域流量的自动化管理与智能交互
  • 软件测试工程师必须掌握的数据库基础知识:从入门到实战
  • Redis持久化策略
  • 基于Systick系统滴答定时器的延时时间计算
  • 2025房建首选品牌揭晓!空气能行业里谁上榜了? - 博客湾
  • SI2318 场效应管参数详解
  • 选对自动获客软件,少走弯路!AI 招财兔实测体验
  • 2026年NMN十大品牌权威榜单|抗衰健康热门品牌深度测评与选购指南 - 速递信息
  • 从 1000 行巨型组件到可维护前端:某内部平台踩坑实录(福袋代码版)
  • 2026天津优质国际高中推荐:天津比较好的国际高中择校指南 - 品牌2026
  • 2026 年弱电机电工程行业标杆企业深度解析 —— 以四川远瞻赢实业集团有限公司为核心 - 深度智识库
  • 2026年上海雅思机构怎么选?三个维度深度解析 - 资讯焦点
  • Fast-DDS 性能优化分析报告
  • 十大眼霜推荐榜!女士眼霜哪个牌子的效果好?2026精准解决眼周问题首选这款 - 资讯焦点
  • LeetCode热题100 N 皇后
  • 2026净肤保湿沐浴露实测:告别油腻假滑,5款高口碑闭眼入 - 资讯焦点
  • 2026年种植体品牌深度测评:五大主流品牌全维度对比分析 - 资讯焦点
  • 我把 Cursor 换成了 Trae:7天深度体验后,这3个功能让我回不去了
  • 2026上海B2B企业出海:推荐5家靠谱的Facebook推广获客服务商与海外社媒代运营公司(附带联系方式) - 品牌2025
  • 2026美白去口臭牙膏选购指南!市面上去牙渍牙膏推荐哪款?亮齿护龈选它 - 资讯焦点
  • 好影教育是正规机构吗? - 资讯焦点
  • AI临终牧师:记录废弃算法最后的“忏悔“
  • AD 极坐标操作方式
  • 2026美国投资移民中介排名及行业机构解析 - 品牌排行榜
  • 微信也能定时发消息了?这个隐藏功能,很多人都不知道!
  • 2026市场总监必看:客户精细化运营怎么选系统?附5大盘点 - 纷享销客智能型CRM
  • 模型预测控制专题(九)—— 进一步优化的方向