当前位置: 首页 > news >正文

开源高性能文档提取利器Kreuzberg:支持75+格式、OCR及Docker部署

以下是对 Kreuzberg 的简单介绍:

  • 这是一个基于 Rust 内核的多语言文档智能框架,它可以从 PDF、Office 文档、图像以及 76 种以上的文件格式中提取文本、元数据和结构化信息
  • 为 Rust、Python、TypeScript/Node.js、Ruby、Go、Java、C#、PHP、Elixir、R 和 C 提供原生SDK
  • 支持多种OCR驱动,包括Tesseract、PaddleOCR、EasyOCR,可通过插件 API 扩展
  • 由 Rust 编写,高性能,内存利用高效,适用超大文档解析
  • 部署使用方式灵活,可作为库、CLI 工具、REST API 服务器或 MCP 服务器使用,提供Docker部署方式
  • 该工具的开源地址参考:https://github.com/kreuzberg-dev/kreuzberg

Docker快速部署与API调用示例参考:开源高性能文档提取利器Kreuzberg:支持75+格式、OCR及Docker部署https://blog.luler.top/d/110

http://www.jsqmd.com/news/432964/

相关文章:

  • 降AI工具三步工作流:检测→处理→验证的标准化流程 - 还在做实验的师兄
  • SpeedAI和比话降AI怎么选?1.2元vs8元的真实差距 - 还在做实验的师兄
  • 去AI味提示词大全:25条指令让论文回归人类写作风格 - 还在做实验的师兄
  • 3.3软考高项-每日5题
  • AI率从90%降到10%以下:我的分段治疗法(真实案例复盘) - 还在做实验的师兄
  • 2026论文AI率标准全解读:本科30%、硕士15%、博士10%背后的逻辑 - 还在做实验的师兄
  • 知网vs维普AIGC检测大对比:算法差异和应对策略全解析 - 还在做实验的师兄
  • 知网AIGC检测算法升级后怎么降AI?2026最新应对方案 - 还在做实验的师兄
  • OpenClaw中文版Molili正式接入微信/钉钉:发消息即可操控电脑执行任务
  • 降AI工具TOP5排行榜:从踩坑到选对,我的真实经历 - 还在做实验的师兄
  • ESP32-S3 USB游戏枪(9轴IMU+USB HID)完整设计方案
  • 73%毕业生AI率过高:这不是个人问题,是系统性困境 - 还在做实验的师兄
  • 树状数组(1)
  • 《B3846 [GESP样题 一级] 闰年求和》
  • 手动降AI公式:5个维度改写让AI率直降50% - 还在做实验的师兄
  • 线性规划对偶小记
  • 如何在3ds Max中使用Corona渲染器打造逼真夜景!
  • 国内口碑宠物医生优选,2026养宠不再愁,狗狗义眼植入/猫咪眼睑外翻手术/狗狗绝育/宠物体检/眼科,宠物医生推荐排行榜 - 品牌推荐师
  • 863545
  • 好用的HTTPS免费证书在线申请
  • 同是写内容,凭什么他的排名第一?秘密藏在这 16 条SEO内容创作技巧里!!
  • 深入解析Python面向对象中的属性与方法内存管理
  • 2026武汉废旧金属回收优质服务商推荐榜 - 资讯焦点
  • 一键开启大模型微调!Unsloth让“炼丹“门槛降到“会点鼠标“级别
  • 基于Simulink的下垂控制在多整流器并联中的应用​
  • 实测2025抗皱面膜TOP5!BFBY美白修护面膜凭什么稳坐第一?干纹斑点全拿捏 - 资讯焦点
  • 2月做题记录
  • 2026氯化钙优质厂家推荐榜 多维度实力解析 - 资讯焦点
  • 2026年3月国内移民中介公司哪个专业靠谱?正规机构推荐飞际移民! - 资讯焦点
  • 榜单发布:2026年春季养老保险规划推荐TOP6,六家机构价值图谱与选购指南 - 资讯焦点