当前位置: 首页 > news >正文

81k Star! RAGFlow:开源RAG引擎,深度文档理解+Agent编排

做 RAG 应用最头疼的是什么?不是向量数据库,不是 LLM 选型,而是文档解析

PDF 里的表格丢了、图片里的内容完全忽略、扫描件直接报废——这些都是现有 RAG 方案的通病。解析质量上不去,检索再准也没用。

RAGFlow 就是盯准这个问题做的——基于深度文档理解(Deep Document Understanding)的 RAG 引擎,不只是「把文档切块丢向量库」,而是真正理解文档结构,再结合 Agent 能力做上下文层。

81k Star,增速稳定,已经是开源 RAG 方向的主流选择。


核心数据

• ⭐ GitHub Star:81.4k+

• 📊 支持格式:PDF、DOCX、Excel、PPT、Markdown、网页、图片OCR

• 🧠 核心能力:深度文档理解(DeepDoc)+ RAG + Agent编排

• 🔧 内置 Agent 工作流 + MCP 支持

• 🐳 完整 Docker 部署方案

• ☁️ 云服务:https://cloud.ragflow.io

• 🔓 开源协议:Apache 2.0

• 🆕 最新支持:DeepSeek v4、Gemini 3 Pro、GPT-5 系列


核心功能

1. 深度文档理解(DeepDoc)

这是 RAGFlow 和其他 RAG 框架最大的区别。

普通 RAG:PDF → 文本提取 → 切块 → 向量化(表格、图片、排版全部丢失)

RAGFlow:PDF →结构识别(表格、标题层级、图片位置)→ 语义切块 → 向量化 + 结构化索引

# RAGFlow 的文档解析示例(概念性)# 上传一份 50 页的 PDF 财报# - 表格被完整识别为结构化数据# - 图片中的文字通过 OCR + 多模态模型理解# - 标题层级保留,切块时不会把章节切断

实测效果:同样一份复杂 PDF,RAGFlow 的回答准确率明显高于直接用 LangChain 的 PDF Loader。

2. 可视化 Agent 工作流

RAGFlow 不只是 RAG 引擎,还内置了 Agent 编排能力(2025-08 支持)。

可以在界面上拖拽编排 Agent 工作流:查询理解 → 多路召回 → 重排序 → LLM 生成 → 结果校验,全流程可视化。

3. MCP 支持

RAGFlow 支持作为 MCP Server 运行,你的数据集可以直接被 Claude Desktop、Cursor 等 MCP 客户端调用。

还有官方 RAGFlow Skill for OpenClaw,在 OpenClaw 里一键接入 RAGFlow 数据集。

4. 多源数据同步

支持从 Confluence、S3、Notion、Discord、Google Drive 同步数据(2025-11 支持),企业知识库场景直接覆盖。

5. 多种文档解析方法

支持 MinerU 和 Docling 作为文档解析后端(2025-10 支持),可以根据文档类型选择最合适的解析策略。


部署教程

方式一:Docker 一键启动(推荐)

# 克隆仓库cd# 启动(CPU版本)docker# 访问 http://localhost:80

完整配置在docker-compose.yml,包含:

• RAGFlow 主服务

• Elasticsearch(向量存储 + 全文检索)

• MySQL(元数据存储)

• Redis(缓存)

方式二:GPU 版本(推荐生产)

# 使用带 GPU 支持的镜像cddockerdocker

GPU 版本在嵌入模型推理和文档解析上速度提升显著,生产环境建议上 GPU。

方式三:从源码启动(开发)

gitgitcd# 安装依赖pip# 启动服务python

💡提示:

首次启动会自动下载嵌入模型和 LLM 配置,确保网络通畅。国内用户建议提前配置 HuggingFace 镜像源。

配置 LLM

启动后进入设置,配置你使用的 LLM(支持 OpenAI、DeepSeek、Gemini、本地 Ollama 等):

# conf/ragflow.cfg 示例

实战场景

场景1:企业知识库问答

上传公司所有技术文档、API 文档、历史工单,RAGFlow 解析后构建知识库。员工提问时,回答能精确引用原文表格和数据。

场景2:法律/金融文档分析

法律合同、财报通常格式复杂,普通 RAG 解析效果差。RAGFlow 的深度文档理解能保留表格结构和条款层级,分析质量明显更高。

场景3:多模态文档问答

PDF 里既有文字又有图片(如技术手册、论文),RAGFlow 可以用多模态模型理解图片内容,问答时覆盖图文信息。


横向对比

| 特性 | RAGFlow | Dify | LangChain | Haystack |

|------|---------|------|-----------|----------|

| 深度文档解析 | ✅ 核心能力 | ⚠️ 基础 | ⚠️ 需自行集成 | ⚠️ 需自行集成 |

| 复杂表格识别 | ✅ 内置 | ❌ 不支持 | ❌ 不支持 | ⚠️ 有限 |

| 图片OCR+理解 | ✅ 多模态 | ⚠️ 基础 | ❌ 不支持 | ❌ 不支持 |

| Agent工作流 | ✅ 可视化 | ✅ 可视化 | ⚠️ 代码编排 | ⚠️ 代码编排 |

| MCP支持 | ✅ 内置 | ❌ 不支持 | ❌ 不支持 | ❌ 不支持 |

| 多源数据同步 | ✅ 内置 | ⚠️ 有限 | ⚠️ 需自行开发 | ⚠️ 需自行开发 |

| Docker部署 | ✅ 完整方案 | ✅ 完整方案 | ⚠️ 需自行搭建 | ⚠️ 需自行搭建 |

| 开源 | ✅ Apache 2.0 | ✅ Apache 2.0 | ✅ MIT | ✅ Apache 2.0 |

ℹ️信息:

RAGFlow 的核心差异化是文档解析质量。如果你的 RAG 场景里文档格式复杂(PDF财报、法律合同、技术手册),RAGFlow 比其他方案效果好很多。如果文档都是纯文本/Mardown,差异不大。


踩坑提示

  1. Elasticsearch 需要分配足够内存:默认配置需要 4GB+ 内存,内存不够会 OOM,建议修改ESJAVAOPTS调低

  2. 首次启动下载模型慢:嵌入模型从 HuggingFace 下载,国内网络建议提前手动下载放到models/目录

  3. GPU 镜像体积大ragflow:gpu镜像约 15GB,确保磁盘空间充足

  4. 多模态理解需要配置视觉模型:默认只配了文本 LLM,图片理解需要额外配置 GPT-4V / Gemini Vision / 本地多模态模型

  5. Confluence/S3 同步需要配置凭证,在「数据源」设置里填对应的 Access Key


总结

RAGFlow 的核心价值一句话:把 RAG 里最难的「文档解析」这件事做到了开源第一梯队

深度文档理解 + Agent 工作流 + MCP 支持,这三个能力组合起来,让它不只是个 RAG 框架,而是一个完整的 AI 知识层解决方案。

81k Star,Apache 2.0 协议,Docker 完整部署方案,生产可用。如果你的 RAG 应用对文档解析质量有要求,RAGFlow 是目前开源里最值得试的那个。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/925391/

相关文章:

  • 深度实战:5步构建高性能Sunshine游戏串流服务器
  • Video2X终极指南:5个简单步骤实现AI视频增强与画质修复
  • 运维测试人员转网安必看:转行方向 + 方法 + 避坑指南
  • 90%的人根本不会跟AI说话:AI老兵的DeepSeek Prompt实战避坑指南
  • 绝对值 - ace-
  • 如何快速实现网盘直链下载:免费开源工具的完整使用指南
  • 告别‘调包侠’:在EduCoder上用纯NumPy实现CNN前向传播的避坑指南
  • 5分钟精通跨平台资源下载:res-downloader全面实战指南
  • OpenCode 源码解读报告
  • Gemini账号彻底删除操作手册:从界面点击到服务器级数据擦除的12个关键节点验证
  • Claude Code效率翻倍的秘密:老程序员压箱底的快捷键圣经
  • 2026 电动快枪盘 vs 气动快换盘 vs 气动换枪盘|焊接与通用快换全场景对比推荐(源头厂家实测) - GrowthUME
  • Jsxer:Adobe脚本二进制文件的终极解码方案
  • 面向法律合规Agent的Harness规则引擎
  • 196、运动控制中的行业应用:人形机器人运动控制
  • 电子投票小程序怎么做,小程序免费教程 - 投票小程序
  • 实时风控延迟突破800ms?Gemini模型轻量化改造实录:FP16+结构剪枝+ONNX Runtime加速,端到端压降至42ms
  • RAG :构建测试数据集
  • 戴森球计划工厂蓝图库:5000+模块化工业设计解决方案深度解析
  • Multi-Agent商业模式:平台化生态构建与开发者激励策略
  • 用Arduino Nano与8x8 LED矩阵复刻《太空侵略者》街机游戏
  • 047、知识蒸馏改进 YOLO:用大模型软标签指导小模型训练的全流程实战
  • 企业级微信自动化解决方案:基于Python的智能机器人实战指南
  • 社区老年人健康监护系统原型设计作业 - xiaoxi
  • 如何永久保存微信聊天记录:WeChatMsg让你轻松掌控数字记忆的完整指南
  • 能快速导出无水印的AI证件照一键生成工具有哪些?2026免费无水印AI证件照工具推荐 - 科技大爆炸
  • 197、运动控制中的行业应用:四足机器人步态控制
  • 井下做业实景透明.智能预警透明化三维立体重构AI预判盲区管控
  • 如何打造终极随身游戏库:Playnite便携版完整配置教程
  • 为什么83%的Gemini A/B测试结论被评论数据推翻?——用户原声分析的4个反直觉真相