当前位置: 首页 > news >正文

RAG 开源项目排行榜(2026 年 5 月)

数据来源:GitHub Stars 排行榜、gh-spy 扫描、多源交叉验证。Stars 为近似值,实时数据以 GitHub 为准。


文章目录

    • 一、总榜 Top 15(按 GitHub Stars 排序)
    • 二、按定位分类——别只看 Stars,看类型
      • 🔧 类型 A:RAG 专用引擎(就是做 RAG 的)
      • 🏗️ 类型 B:全栈 AI 平台(RAG 是功能之一)
      • 🧩 类型 C:RAG 开发框架(给开发者用的 SDK)
      • 📚 类型 D:教育资源(学 RAG 用的)
    • 三、关键维度对比
      • 检索策略
      • 部署难度
      • 文档解析能力
    • 四、活跃度与维护健康度
    • 五、选型决策树
    • 六、趋势判断:RAG 下半场
      • 1. AgentRAG 是主战场
      • 2. 文档解析深度决定上限
      • 3. 混合检索成为标配
      • 4. 评估体系从"感觉还行"到"指标说话"
    • 七、WeKnora 在榜单中的位置

一、总榜 Top 15(按 GitHub Stars 排序)

排名项目⭐ Stars语言定位维护状态
1Dify~141kTypeScript / Python低代码 AI 应用平台(含 RAG 引擎)🟢 极度活跃
2Open WebUI~137kPython用户友好的 AI 界面(Ollama + OpenAI)🟢 活跃
3LangChain~137kPython / JS通用 LLM 编排框架(RAG 是子集)🟢 极度活跃
4awesome-llm-apps~110kPython100+ 可运行 AI Agent & RAG 应用合集🟡 教程型
5RAGFlow~80kPython专注 RAG 引擎 + Agent,深度文档理解🟢 极度活跃
6Anything-LLM~60kJavaScript多合一 AI 生产力工具,隐私优先🟢 活跃
7LlamaIndex~40kPython / JSRAG-First 数据框架,检索最强🟢 活跃
8LightRAG~35kPython港大出品,轻量快速 RAG(EMNLP 2025)🟢 活跃
9GraphRAG~33kPython微软出品,知识图谱驱动的 RAG🔴 降温(月提交 3)
10RAG_Techniques~27kPythonRAG 高级技巧合集 + Notebook 教程🟡 教程型
11FastGPT~23kTypeScript工作流 + 知识库,国产低代码平台🟢 活跃
12Haystack~20kPython生产级 Pipeline 架构,企业首选🟢 活跃
13QAnything~13kPython网易有道出品,BCEmbedding + Reranker🟡 中等
14WeKnora~15kGo / Vue腾讯出品,文档理解 + 混合检索 + Agent🟢 活跃
15MaxKB~12kPython开箱即用企业级 AI 智能体平台🟢 活跃

二、按定位分类——别只看 Stars,看类型

Stars 多不等于"更好用"。Dify 141k star,但它是全栈 AI 平台,RAG 只是其中一个功能;RAGFlow 80k star,才是专注 RAG 的引擎。选项目先选类型。

🔧 类型 A:RAG 专用引擎(就是做 RAG 的)

项目Stars核心能力适合谁
RAGFlow~80kDeepDoc 文档解析、OCR、布局识别、GraphRAG、Agentic RAG文档密集场景、需要深度解析
LightRAG~35k轻量快速、图结构检索、EMNLP 论文加持学术研究、快速原型
GraphRAG~33k知识图谱驱动、跨文档关联发现需要图谱推理的场景
QAnything~13kBCEmbedding 自研模型、Reranker、离线部署中文场景、隐私优先
WeKnora~15k混合检索(关键词+向量+图谱)、ReACT Agent、多租户企业知识管理、需对接 Agent
R2R~8kRESTful API、Agentic RAGAPI 优先的集成场景
Verba~8kWeaviate 原生、轻量Weaviate 生态用户

🏗️ 类型 B:全栈 AI 平台(RAG 是功能之一)

项目StarsRAG 能力其他能力适合谁
Dify~141k内置知识库、混合检索、Q2Q 召回工作流编排、Agent、多模型管理企业级全场景
FastGPT~23k知识库 + 工作流可视化对话流、API 编排中小团队快速搭建
MaxKB~12k知识库问答工作流、Agent、多模型开箱即用型企业
Anything-LLM~60k文档向量化 + 问答多 LLM 支持、本地优先个人 / 小团队

🧩 类型 C:RAG 开发框架(给开发者用的 SDK)

项目Stars核心抽象适合谁
LangChain~137kChain / Agent / Retriever通用 LLM 开发、灵活编排
LlamaIndex~40kIndex(向量/关键词/图谱/树)RAG-First、复杂检索模式
Haystack~20kPipeline(有向图组件)生产级、企业部署
DSPy~10kSignature + Optimizer自动化调优、标注数据驱动
Ragas~8k评估指标(Faithfulness / Relevancy)RAG 质量评估

📚 类型 D:教育资源(学 RAG 用的)

项目Stars内容适合谁
awesome-llm-apps~110k100+ 可运行 AI & RAG 应用入门学习、找灵感
RAG_Techniques~27kRAG 高级技巧 + Notebook 教程进阶学习、查方案

三、关键维度对比

检索策略

项目纯向量关键词(BM25)知识图谱混合检索
RAGFlow✅(GraphRAG)
WeKnora
LightRAG✅(图结构)部分
GraphRAG✅(核心)
Dify
LlamaIndex
QAnything

部署难度

项目Docker 一键本地免 Docker云端 SaaS私有化部署
RAGFlow
Dify
WeKnora✅(一键镜像)
Anything-LLM
FastGPT
QAnything

文档解析能力

项目PDFWord图片 OCR表格MarkdownHTML
RAGFlow✅ 深度✅ 强✅ 强
WeKnora✅ 深度
Dify✅ 基础⚠️ 有限⚠️ 有限
LlamaIndex✅(LlamaParse)
QAnything⚠️

四、活跃度与维护健康度

来自 gh-spy 扫描数据(RAG 专用引擎维度):

项目月提交Open IssuesIssue 平均关闭天数贡献者健康评级
RAGFlow3383000+33.6 天463A/F/A/A(活跃但维护滞后)
LightRAG18822624.5 天246A/D/A/A(活跃且较健康)
GraphRAG317.2 天50D/D/B/A(降温但还在响应)
R2R029.9 天61F/D/B/B(已停更)
Verba278.4 天37D/F/B/B(大厂 Demo 模式)
AutoRAG0149524.5 天26F/F/C/B(已停滞)

三个关键洞察:

  1. RAGFlow 独占赛道 40% star——马太效应明显,但 3000+ open issues 说明增长快维护跟不上
  2. 大厂项目"发布后降温"定律——微软 GraphRAG(月提交 3)、NVIDIA ChatRTX(1 贡献者)、Weaviate Verba(月提交 2),无一例外降温
  3. 真正持续的是创业公司(RAGFlow/InfiniFlow)和学术团队(LightRAG/港大)

五、选型决策树

你的需求是什么? │ ├─ 我要开箱即用,不想写代码 │ ├─ 企业级全功能 → Dify │ ├─ 个人/小团队 → Anything-LLM │ └─ 中文知识库 → FastGPT / MaxKB │ ├─ 我要专注 RAG 引擎 │ ├─ 文档深度解析(OCR、表格、布局)→ RAGFlow / WeKnora │ ├─ 轻量快速、学术场景 → LightRAG │ ├─ 知识图谱推理 → GraphRAG / WeKnora │ └─ 中文优化、离线部署 → QAnything │ ├─ 我是开发者,要 SDK │ ├─ RAG-First、复杂检索 → LlamaIndex │ ├─ 通用 LLM 编排 → LangChain │ ├─ 生产级 Pipeline → Haystack │ └─ 自动调优 → DSPy + Ragas │ └─ 我要学 RAG ├─ 看技巧合集 → RAG_Techniques └─ 跑现成应用 → awesome-llm-apps

六、趋势判断:RAG 下半场

1. AgentRAG 是主战场

纯 RAG 已经不够了。RAGFlow 融合 Agent,WeKnora 内置 ReACT Agent,Dify 有工作流 + Agent——RAG + Agent 才是下半场

2. 文档解析深度决定上限

“垃圾进,垃圾出”——RAG 的天花板不在检索算法,在文档解析。RAGFlow 的 DeepDoc、WeKnora 的多模态解析、LlamaIndex 的 LlamaParse,都在啃这块硬骨头。

3. 混合检索成为标配

单一向量检索覆盖不了所有场景。关键词 + 向量 + 图谱混合检索,已经是主流项目的共识。

4. 评估体系从"感觉还行"到"指标说话"

Ragas、DSPy 的崛起说明:RAG 不能只靠人肉体验评估,自动化评测 + 持续优化才是工程化正道。


七、WeKnora 在榜单中的位置

维度WeKnora 的位置
Stars (~15k)中等,但增长快(腾讯 2025 年底开源)
RAG 引擎排名第二梯队头部,与 QAnything 同级
独特优势混合检索三合一、ReACT Agent、腾讯生态(微信对话开放平台)
与其他项目差异Go 语言后端(性能)、MCP 工具集成、多租户

一句话:WeKnora 不是 star 最多的,但在"企业级 RAG + Agent"这个交叉领域,功能完整度能打。特别是你同时用 OpenClaw + Hermes 的场景,WeKnora 的 MCP 集成和 API 优先设计,对接成本最低。

http://www.jsqmd.com/news/865058/

相关文章:

  • 交大樊同学-UMLChina建模答题赛第7赛季第12轮
  • New API架构深度解析:构建企业级AI模型网关的技术实现
  • 如何用AI一键智能分层:Layerdivider让插画秒变可编辑PSD
  • ChatGPT写SEO文章=自毁流量?2023真实案例库显示:83.6%的AI内容因这2个元数据缺失遭算法惩罚
  • 3分钟掌握Photoshop AI绘画插件:Auto-Photoshop-StableDiffusion-Plugin完全指南
  • 3个核心技巧深度解析TexasSolver:构建高效GTO策略的实战指南
  • 如何快速部署CodeCombat游戏化编程教学系统:企业级本地化完整方案
  • Motrix WebExtension终极指南:3步让浏览器下载速度提升300%
  • 终极免费视频下载指南:3分钟掌握VideoDownloadHelper插件
  • 2026南昌民商事与医疗纠纷律师推荐:专业、靠谱、负责任 - 品牌2025
  • 通过curl命令直接测试Taotoken多模型API的响应与兼容性
  • 为你的OpenClaw智能体工作流配置Taotoken作为稳定可靠的大模型供应商
  • 太原科技大学李岩团队ELTDF-Net:基于局部感知残差门控多频域卷积注意力PAUT焊接缺陷检测模型
  • TypeScript 入门基础:与原生 JavaScript 的详细对比
  • SteamDeck_rEFInd:Steam Deck双系统引导管理工具完全指南 [特殊字符]
  • 多智能体与多技能区别以及优缺点,怎么选择:AI协作开发的终极对决
  • 别再死磕 Elasticsearch 了,这个轻量级搜索引擎更香
  • 2026南昌民商事纠纷律师测评:南昌专业资深代理律师推荐 - 品牌2025
  • 前端性能分析工具利器
  • 上海回升交通设施工程:黄浦正规的小区划线公司选哪家 - LYL仔仔
  • 利用Taotoken模型广场为不同应用场景选择性价比最优模型
  • 终极HTML转Figma实战指南:3步将网页秒变可编辑设计稿
  • 彻底告别Microsoft Edge:Windows系统级浏览器卸载完全指南
  • 2026 曲靖专业防水公司TOP5推荐:卫生间、外墙、楼顶、地下室渗漏专业公司推荐(2026年5月曲靖最新深度调研方案) - 防水百科
  • 从账单明细看Taotoken按Token计费模式的清晰与便捷
  • 南开区黄金回收店铺盘点 连锁分店辐射天津多地服务 - 润富黄金珠宝行
  • 隧道能见度COVI二氧化氮检测器:隧道里的“空气管家”。
  • 如何快速掌握JSON对比工具:终极效率提升指南
  • 终极指南:如何用智能脚本永久激活你的Windows和Office系统
  • 2026年软考高级——系统架构设计师预测试卷(三)