当前位置: 首页 > news >正文

Chandra OCR 2发布:OCR领域的性能飞跃与商业新机遇

【导语:2026年3月发布的Chandra OCR 2是一款前沿OCR模型,能将图像和PDF转换为结构化格式并保留布局信息。它在多方面有显著提升,性能卓越,支持多语言,为文档处理带来新变革。】


Chandra OCR 2:功能特性大揭秘

Chandra OCR 2具有众多出色的功能特性。它性能卓越,在外部olmocr基准测试和内部多语言基准测试中表现亮眼。能将文档转换为带有详细布局信息的Markdown、HTML或JSON格式,支持90多种语言,具备优秀的手写文字识别能力,还能准确重建表单,包括复选框。在处理表格、数学公式和复杂布局时表现良好,可提取图像和图表,并添加标题和结构化数据。此外,它提供本地(HuggingFace)和远程(vLLM服务器)两种推理模式,还提供托管API,用户可通过免费在线测试平台试用。

基准测试:Chandra 2优势凸显

Chandra 2着重提升了多语言性能。由于缺乏优质公开多语言OCR基准测试,研发团队自行创建测试,涵盖表格、数学公式等多方面。从基准测试表格来看,Chandra 2在多个项目上表现出色。例如在ArXiv项目中得分为90.2,旧扫描件为89.3,数学为89.9等,总体得分85.9 ± 0.8,优于众多竞品,如dots.ocr 1.5总体得分83.9,olmOCR 2总体得分82.4等。

在多语言基准测试中,涵盖43种常见语言,Chandra 2在部分语言上表现突出。如在德语(de)测试中得分为94.8%,高于Chandra 1的83.0%和Gemini 2.5 Flash的88.3%;在丹麦语(da)测试中得分为91.1%,也高于其他部分模型。

安装与使用:便捷多样的选择

Chandra OCR 2提供多种安装方式。包安装方面,有基础安装(适用于vLLM后端)、使用HuggingFace后端(包含torch、transformers)以及安装所有扩展等方式。若使用HuggingFace方法,建议安装flash attention以提升性能。也可从源代码安装,通过git克隆仓库并进行相关操作。

使用方法上,提供CLI工具,可处理单个文件或整个目录,有多种CLI选项供用户灵活配置,如推理方法、页码范围、最大令牌数等。还提供Streamlit网页应用,可启动交互式演示处理单页文档。对于生产部署或批量处理,可使用vLLM服务器,通过环境变量进行配置。

商业使用:许可与发展前景

此代码遵循Apache 2.0许可,模型权重使用修改后的OpenRAIL - M许可,适用于研究、个人使用和资金/收入低于200万美元的初创公司,不得与官方API进行竞争使用。若要移除OpenRAIL许可限制或获取更广泛的商业许可,可访问定价页面。Chandra OCR 2凭借其卓越的性能和丰富的功能,有望在商业领域获得广泛应用,为文档处理相关产业带来新的发展机遇。

编辑观点:Chandra OCR 2在OCR领域展现出强大实力,性能提升显著,功能丰富多样。其多语言支持和复杂内容处理能力使其具有广泛的应用前景,有望在文档处理市场占据重要地位,推动行业发展。

http://www.jsqmd.com/news/548277/

相关文章:

  • 基于Qwen3-VL:30B的智能推荐系统实战
  • 2026中国木门十大品牌排行榜:行业品质之选 - 品牌排行榜
  • 麒麟V10系统下PyCharm的安装与JRE配置全指南
  • 微信小程序跳转配置全攻略:navigateToMiniProgramAppIdList详解(附常见问题)
  • Commons-Collections1从简单的业务视角由浅入深轻松理解正常业务产生漏洞的固有矛盾
  • 500 Global聘请前IFC首席信息官,助力公司拓展全球投资平台
  • C++ 原子操作底层实现
  • 2026年靠谱的一体化污水处理设备/厌氧湿地一体化污水处理设备/全自动一体化污水处理设备/农村一体化污水处理设备厂家信誉综合参考 - 行业平台推荐
  • Cosmos-Reason1-7B与Nodejs集成:环境配置与API开发指南
  • LFM2.5-1.2B-Thinking-GGUF代码实例:Shell脚本自动化测试常用Prompt集合
  • 2026好玩的电脑游戏推荐几个 二次元竞技类热门之选 - 品牌排行榜
  • 3步释放C盘空间:给Windows用户的智能迁移方案
  • 关于函数,我猜你一定不知道Python还能这么玩
  • AIGC内容创作新范式:Qwen3-0.6B-FP8辅助短视频脚本生成
  • 蓝桥杯练习0327
  • 初始化表为何需引用符号
  • Claude Code 使用中转api
  • Llava-v1.6-7b跨平台开发:Qt框架集成指南
  • 2026年推荐一些可以免费玩的电脑游戏合集 - 品牌排行榜
  • 我的闹钟有时候会发生异常----需要完整的异常处理
  • 深入解析Java内存模型(JMM)与并发问题:从原理到解决方案
  • 外地来京就医陪诊科普:哪些患者最需要陪诊服务?如何选择适配的陪诊机构? - 品牌排行榜单
  • 2026年靠谱的通勤运动摩托车/长途运动摩托车/越野运动摩托车/运动摩托车试驾新厂实力推荐(更新) - 行业平台推荐
  • 2026年热门的定制纸杯/可降解纸杯/广告纸杯推荐公司 - 行业平台推荐
  • 2026年低配置电脑也能玩的游戏有哪些推荐 - 品牌排行榜
  • 2026年江苏有哪些ERP企业推荐?这份榜单值得参考 - 品牌排行榜
  • 【ComfyUI】Qwen-Image-Edit-F2P在Qt桌面应用中的集成:开发本地化的人像生成工具
  • 零基础玩转ANIMATEDIFF PRO:手把手教你制作电影感光斑特效
  • 2026常州本地主要的ERP服务商有哪些? - 品牌排行榜
  • 终极指南:如何在3分钟内免费解锁米哈游游戏世界的神秘字体