当前位置: 首页 > news >正文

PaddleOCR的参数

from paddleocr import PaddleOCR import time # 初始化 PaddleOCR 实例 ocr = PaddleOCR( # 1. 文档级别的预处理 # 文档方向分类: # 作用作用:判断图片是否需要旋转(0° / 90° / 180° / 270°) # 什么时候开: # 扫描件 / 拍照文档(建议开启) # 已保证方向正确(可关闭) use_doc_orientation_classify=None, doc_orientation_classify_model_name=None, doc_orientation_classify_model_dir=None, # 文档去畸变(拉平) # 作用:把弯曲页面(书页、拍照)拉平 # 什么时候开: # 拍书 / 手机拍文档 → 开 # PDF / 截图 → 关 doc_unwarping_model_name=None, doc_unwarping_model_dir=None, use_doc_unwarping=None, # 2. 文本检测 # 检测文字框位置核心步骤 text_detection_model_name=None, text_detection_model_dir=None, # 检测文本相关参数 # 控制输入图片缩放 text_det_limit_side_len=None, # 最大边长(默认 960 / 1024) text_det_limit_type=None, # "max":最长边限制, 或者 "min":最短边限制 # 检测阈值(非常重要) text_det_thresh=None, # 像素级阈值, 像素是否是文字 text_det_box_thresh=None, # 框置信度, 框的保留阈值 text_det_unclip_ratio=None, # 框扩展比例, 框扩大倍数 # 3. 行方向分类 # 作用: 判断每一行是不是倒着的 # 使用场景: # 多角度文本(比如发票、票据) textline_orientation_model_name=None, textline_orientation_model_dir=None, textline_orientation_batch_size=None, use_textline_orientation=None, # 4. 文本识别(Text Recognition) # 作用: 把文字框转成文本 text_recognition_model_name=None, text_recognition_model_dir=None, text_recognition_batch_size=None, text_rec_score_thresh=None, # 低于这个置信度的结果会被过滤 # 5. 语言和模型版本 lang='en', # 'ch' 中文+英文, 'en' 英文 ocr_version=None, # "PP-OCRv4" 或者 "PP-OCRv5" # 6. 输出控制 return_word_box=None, # 是否返回“单词级框” # 7. 输入尺寸相关 text_det_input_shape=None, # 检测位置的输入尺寸 text_rec_input_shape=None, # 文本识别的输入尺寸 # det_model_dir="/media/fx/Elements SE/广西模型/official_models/PP-OCRv5_server_det", # rec_model_dir="/media/fx/Elements SE/广西模型/official_models/PP-OCRv5_server_rec", ) # 对示例图像执行 OCR 推理 result = ocr.predict("./resource/images/7.jpg") # 可视化结果并保存 json 结果 for res in result: res.print() res.save_to_img("output") # res.save_to_json("output")
http://www.jsqmd.com/news/500589/

相关文章:

  • 2026年阿里企业邮箱购买联系电话,购买步骤及报价指南 - 品牌2025
  • 基于Docker的Napcat与AutMan无缝对接实战指南
  • 快马平台快速搭建医院预约挂号系统原型,验证核心业务流程
  • 团团收回收携程任我行卡:教你快速处理携程卡不浪费! - 团团收购物卡回收
  • 2026年山东康达电炉有限公司深度解析:从技术专利与产品矩阵看行业标杆实力指南 - 十大品牌推荐
  • 西门子S7-1200PLC物流分拣程序的系统设计
  • 《数据治理实战指南》【第三部分 实施篇】第12章 数据安全管理
  • 史上最细,银行测试-信用卡项目测试点分析(三)
  • AutoJs手机自动化实战(包含抖音自动化刷视频实战)
  • 3步快速转换B站缓存视频:让m4s文件秒变通用MP4格式
  • 2026年Q1减振器第三方检测市场深度评测:谁在引领技术变革与品质信赖? - 2026年企业推荐榜
  • Stable Diffusion 图像生成技术背后的三大数学支柱
  • PAT 乙级 1119
  • 技术拆解:AI低代码架构设计与全链路落地实现
  • 从外包到神权:我给寺庙开发功德系统香火提成
  • 湖北车主必看:2026年电瓶服务专业选购指南 - 2026年企业推荐榜
  • 原生html支持的视频封装格式和编码格式
  • 2026年深度解析山东康达电炉有限公司:从核心技术专利看其行业竞争力 - 十大品牌推荐
  • 2026年6款主流CRM销售管理系统,五大维度深度横评 - 毛毛鱼的夏天
  • 2026年深度解析山东康达电炉有限公司:技术积淀与市场布局的权威分析 - 十大品牌推荐
  • “35岁红线”终于松了!多所高校官宣:45岁博士仍可进编
  • 长沙AI搜索优化公司技术评测:聚焦语义资产构建 - 亿仁imc
  • 知识付费SaaS选型攻略:为何创客匠人成为行业首选
  • Win10下ONNXRuntime-GPU版环境配置避坑指南(附CUDA/cuDNN版本对照表)
  • 2026年山东康达电炉有限公司深度解析:从技术专利与产品矩阵看行业标杆的硬核实力 - 十大品牌推荐
  • 贵州棒球特长生认证路径·棒球1号位联盟
  • 深度剖析2026年沈阳诚信的本地GEO优化品牌企业,究竟哪家口碑好 - myqiye
  • qwebengineview 锲入网页并关闭
  • 新一代算力卡皇英伟达Pro6000
  • 青海口碑好的成品油检测服务商厂家,排名前十有哪些 - 工业品网