当前位置: 首页 > news >正文

OCR识别助手


链接:https://pan.quark.cn/s/0ddfce865462

是一款基于本地OCR的文字识别小工具,主要用于截图后快速识别文字,也支持导入图片、PDF文件进行识别。
软件整体偏轻量,界面做成了比较传统的灰白风格,方便日常办公、资料整理和临时提取文字。
软件默认使用本地离线OCR,不需要登录账号,也不强制联网。需要远程调用时,可以在设置里开启HTTP服务;
如果有自己的兼容OpenAI 协议接口,也可以切换到自定义AI 服务。

  1. 截图识别:点击按钮或使用自定义热键后,框选屏幕区域并识别文字。
  2. 文件识别:支持导入常见图片格式和PDF 文件进行OCR。
  3. 历史记录:识别结果可进入历史列表,支持搜索、复制、删除单条记录和清空历史。
  4. 自动保存/自动复制:可在设置中开启,识别后自动保存结果或复制文本。
  5. 排版处理:识别结果支持简单整理,例如清理空行、合并段落、按标点换行、整理表格间隔等。
  6. HTTP服务:开启后可通过浏览器页面上传图片/PDF识别,也可以通过接口调用。
  7. 自定义API:支持填写兼容OpenAI 协议的接口地址、API Key 和模型名称,用于调用支持图片输入的模型。
  8. 贴图功能:截图后可将图片贴在桌面上,便于对照资料。
  9. Windows7兼容:提供单文件版本,并对Win7 兼容项做了处理。

使用说明:

  1. 打开软件后,点击“截图识别”即可框选识别区域。
  2. 点击“导入文件”可以选择图片或 PDF。
  3. “设置”里可以设置保存目录、自动复制、自动保存、HTTP服务、自定义API 等。
  4. “设置热键”用于录入截图识别快捷键,设置后可直接用热键唤起截图。
  5. 如果使用网页版识别,需要先在设置里开启HTT 服务,然后访问软件提示的地址。

注意事项:

  1. 本地OCR适合普通截图、图片文字、扫描件等场景,识别效果会受图片清晰度、字体、倾斜角度影响。
  2. 表格识别目前主要是OCR 后做文本整理,不等同于完整Excel 表格还原。
  3. 自定义API 需要选择支持图片输入/视觉能力的模型,否则接口能连通也无法完成OCR。
  4. HTTP服务默认用于本机或局域网访问,如在公网环境使用,请自行注意访问权限和数据安全。5. Windows7环境差异较多,如遇到个别机器运行异常,可以反馈系统版本和报错信息。

更新日志:

v1.2.1 2026.6.26 日更新
新增表格识别按钮,支持表格预览、编辑,并导出XLSX/DOCX/CSV。
新增智能提取:身份证、银行卡、驾驶证、行驶证、营业执照、发票、快递单、车牌。
截图浮标增强:可直接OCR、智能提取、贴图,支持双击识别。
贴图功能增强:新增可拖动文本框,修复贴图窗口跑到底部、尺寸过小问题。
热键设置整合到设置中心,支持文字、表格、各类智能提取分别设置/清空。
主界面精简,去掉多余的贴图、导出、设置热键按钮。
设置中心、历史窗口统一成主界面浅色风格。
历史记录增强:增加预览、收藏、删除、清空、导出。
底部新增快捷键滚动提示、保存路径和HTTP状态显示优化。

http://www.jsqmd.com/news/1088384/

相关文章:

  • 【Netty源码解读和权威指南】第84篇:Netty Channel注册与Selector源码解析
  • Zemax实战:从理论到参数,精准仿真半导体激光器光束
  • Selenium自动化测试:ChromeDriver版本管理策略与实战
  • 360天擎终端安全管理:远程批量运维与安全防护实战解析
  • 游戏性能提升神器:DLSS Swapper终极指南免费解锁显卡隐藏性能
  • 【课程设计/毕业设计】基于 SpringBoot 的建材租赁数据统计管理系统的设计与实现建筑器材租赁信息化管理系统的设计与实现【附源码、数据库、万字文档】
  • 三步解锁:让Blender成为你的3D打印设计中心
  • SUMO仿真环境搭建与HelloWorld实践(一)
  • 瑞萨RA8M1 CEU图像捕获引擎:寄存器配置与内存管理实战
  • 当游戏修改框架遇上在线对战:Street Fighter 6软锁问题的技术侦探之旅
  • 空洞骑士模组管理器Scarab:2024年终极安装与管理指南
  • GPT-4的1.8万亿参数与2%激活率:稀疏专家模型原理与工程实践
  • Brida源码深度解析:打通Burp与Frida的移动安全测试桥梁
  • HsMod终极指南:55个功能全面解锁炉石传说增强体验
  • HsMod终极指南:55项功能全面增强你的炉石传说游戏体验
  • 移动自动化新范式:mobile-mcp协议如何实现跨平台统一测试
  • 5分钟搞定:让Blender无缝支持3MF格式的终极解决方案
  • 智慧树刷课插件终极指南:3分钟实现自动化学习,效率提升300%
  • RA8P1微控制器曼彻斯特编码通信:硬件实现与错误处理实战
  • UI自动化测试进阶:OWL ADVENTURE策略与视觉回归测试实战
  • 终极指南:如何用ROFL-Player轻松分析英雄联盟回放文件
  • APK-Installer:Windows原生运行安卓应用的技术革新
  • Android分屏启动与Task组织者深度解析
  • 5分钟掌握Blender 3MF插件:解锁专业3D打印工作流
  • HS2-HF_Patch:一站式终极汉化与百款插件深度解决方案
  • 瑞萨RA MCU I3C与I2S驱动实战:FSP框架下的传感器与音频开发
  • MCP与零信任融合架构的7大高危漏洞与安全加固实战
  • 如何在5分钟内将Chrome打造成专业的Markdown阅读器?终极效率提升方案
  • TurboQuant:llama.cpp的分组量化加速技术原理与实战
  • Robot Framework中文手册:自动化测试工程师的本地化知识库与实战指南