当前位置：首页 > news >正文

RAG 开源项目排行榜（2026 年 5 月）

news 2026/7/14 0:37:26

数据来源：GitHub Stars 排行榜、gh-spy 扫描、多源交叉验证。Stars 为近似值，实时数据以 GitHub 为准。

文章目录

- 一、总榜 Top 15（按 GitHub Stars 排序）
- 二、按定位分类——别只看 Stars，看类型
- - 🔧 类型 A：RAG 专用引擎（就是做 RAG 的）
  - 🏗️ 类型 B：全栈 AI 平台（RAG 是功能之一）
  - 🧩 类型 C：RAG 开发框架（给开发者用的 SDK）
  - 📚 类型 D：教育资源（学 RAG 用的）
- 三、关键维度对比
- - 检索策略
  - 部署难度
  - 文档解析能力
- 四、活跃度与维护健康度
- 五、选型决策树
- 六、趋势判断：RAG 下半场
- - 1. AgentRAG 是主战场
  - 2. 文档解析深度决定上限
  - 3. 混合检索成为标配
  - 4. 评估体系从"感觉还行"到"指标说话"
- 七、WeKnora 在榜单中的位置

一、总榜 Top 15（按 GitHub Stars 排序）

排名	项目	⭐ Stars	语言	定位	维护状态
1	Dify	~141k	TypeScript / Python	低代码 AI 应用平台（含 RAG 引擎）	🟢 极度活跃
2	Open WebUI	~137k	Python	用户友好的 AI 界面（Ollama + OpenAI）	🟢 活跃
3	LangChain	~137k	Python / JS	通用 LLM 编排框架（RAG 是子集）	🟢 极度活跃
4	awesome-llm-apps	~110k	Python	100+ 可运行 AI Agent & RAG 应用合集	🟡 教程型
5	RAGFlow	~80k	Python	专注 RAG 引擎 + Agent，深度文档理解	🟢 极度活跃
6	Anything-LLM	~60k	JavaScript	多合一 AI 生产力工具，隐私优先	🟢 活跃
7	LlamaIndex	~40k	Python / JS	RAG-First 数据框架，检索最强	🟢 活跃
8	LightRAG	~35k	Python	港大出品，轻量快速 RAG（EMNLP 2025）	🟢 活跃
9	GraphRAG	~33k	Python	微软出品，知识图谱驱动的 RAG	🔴 降温（月提交 3）
10	RAG_Techniques	~27k	Python	RAG 高级技巧合集 + Notebook 教程	🟡 教程型
11	FastGPT	~23k	TypeScript	工作流 + 知识库，国产低代码平台	🟢 活跃
12	Haystack	~20k	Python	生产级 Pipeline 架构，企业首选	🟢 活跃
13	QAnything	~13k	Python	网易有道出品，BCEmbedding + Reranker	🟡 中等
14	WeKnora	~15k	Go / Vue	腾讯出品，文档理解 + 混合检索 + Agent	🟢 活跃
15	MaxKB	~12k	Python	开箱即用企业级 AI 智能体平台	🟢 活跃

二、按定位分类——别只看 Stars，看类型

Stars 多不等于"更好用"。Dify 141k star，但它是全栈 AI 平台，RAG 只是其中一个功能；RAGFlow 80k star，才是专注 RAG 的引擎。选项目先选类型。

🔧 类型 A：RAG 专用引擎（就是做 RAG 的）

项目	Stars	核心能力	适合谁
RAGFlow	~80k	DeepDoc 文档解析、OCR、布局识别、GraphRAG、Agentic RAG	文档密集场景、需要深度解析
LightRAG	~35k	轻量快速、图结构检索、EMNLP 论文加持	学术研究、快速原型
GraphRAG	~33k	知识图谱驱动、跨文档关联发现	需要图谱推理的场景
QAnything	~13k	BCEmbedding 自研模型、Reranker、离线部署	中文场景、隐私优先
WeKnora	~15k	混合检索（关键词+向量+图谱）、ReACT Agent、多租户	企业知识管理、需对接 Agent
R2R	~8k	RESTful API、Agentic RAG	API 优先的集成场景
Verba	~8k	Weaviate 原生、轻量	Weaviate 生态用户

🏗️ 类型 B：全栈 AI 平台（RAG 是功能之一）

项目	Stars	RAG 能力	其他能力	适合谁
Dify	~141k	内置知识库、混合检索、Q2Q 召回	工作流编排、Agent、多模型管理	企业级全场景
FastGPT	~23k	知识库 + 工作流	可视化对话流、API 编排	中小团队快速搭建
MaxKB	~12k	知识库问答	工作流、Agent、多模型	开箱即用型企业
Anything-LLM	~60k	文档向量化 + 问答	多 LLM 支持、本地优先	个人 / 小团队

🧩 类型 C：RAG 开发框架（给开发者用的 SDK）

项目	Stars	核心抽象	适合谁
LangChain	~137k	Chain / Agent / Retriever	通用 LLM 开发、灵活编排
LlamaIndex	~40k	Index（向量/关键词/图谱/树）	RAG-First、复杂检索模式
Haystack	~20k	Pipeline（有向图组件）	生产级、企业部署
DSPy	~10k	Signature + Optimizer	自动化调优、标注数据驱动
Ragas	~8k	评估指标（Faithfulness / Relevancy）	RAG 质量评估

📚 类型 D：教育资源（学 RAG 用的）

项目	Stars	内容	适合谁
awesome-llm-apps	~110k	100+ 可运行 AI & RAG 应用	入门学习、找灵感
RAG_Techniques	~27k	RAG 高级技巧 + Notebook 教程	进阶学习、查方案

三、关键维度对比

检索策略

项目	纯向量	关键词(BM25)	知识图谱	混合检索
RAGFlow	✅	✅	✅（GraphRAG）	✅
WeKnora	✅	✅	✅	✅
LightRAG	✅	❌	✅（图结构）	部分
GraphRAG	❌	❌	✅（核心）	❌
Dify	✅	✅	❌	✅
LlamaIndex	✅	✅	✅	✅
QAnything	✅	✅	❌	✅

部署难度

项目	Docker 一键	本地免 Docker	云端 SaaS	私有化部署
RAGFlow	✅	❌	❌	✅
Dify	✅	❌	✅	✅
WeKnora	✅	✅（一键镜像）	❌	✅
Anything-LLM	✅	✅	❌	✅
FastGPT	✅	❌	✅	✅
QAnything	✅	❌	❌	✅

文档解析能力

项目	PDF	Word	图片 OCR	表格	Markdown	HTML
RAGFlow	✅ 深度	✅	✅ 强	✅ 强	✅	✅
WeKnora	✅ 深度	✅	✅	✅	✅	✅
Dify	✅ 基础	✅	⚠️ 有限	⚠️ 有限	✅	✅
LlamaIndex	✅（LlamaParse）	✅	✅	✅	✅	✅
QAnything	✅	✅	✅	⚠️	✅	❌

四、活跃度与维护健康度

来自 gh-spy 扫描数据（RAG 专用引擎维度）：

项目	月提交	Open Issues	Issue 平均关闭天数	贡献者	健康评级
RAGFlow	338	3000+	33.6 天	463	A/F/A/A（活跃但维护滞后）
LightRAG	188	226	24.5 天	246	A/D/A/A（活跃且较健康）
GraphRAG	3	—	17.2 天	50	D/D/B/A（降温但还在响应）
R2R	0	—	29.9 天	61	F/D/B/B（已停更）
Verba	2	—	78.4 天	37	D/F/B/B（大厂 Demo 模式）
AutoRAG	0	149	524.5 天	26	F/F/C/B（已停滞）

三个关键洞察：

RAGFlow 独占赛道 40% star——马太效应明显，但 3000+ open issues 说明增长快维护跟不上
大厂项目"发布后降温"定律——微软 GraphRAG（月提交 3）、NVIDIA ChatRTX（1 贡献者）、Weaviate Verba（月提交 2），无一例外降温
真正持续的是创业公司（RAGFlow/InfiniFlow）和学术团队（LightRAG/港大）

五、选型决策树

你的需求是什么？ │ ├─ 我要开箱即用，不想写代码 │ ├─ 企业级全功能 → Dify │ ├─ 个人/小团队 → Anything-LLM │ └─ 中文知识库 → FastGPT / MaxKB │ ├─ 我要专注 RAG 引擎 │ ├─ 文档深度解析（OCR、表格、布局）→ RAGFlow / WeKnora │ ├─ 轻量快速、学术场景 → LightRAG │ ├─ 知识图谱推理 → GraphRAG / WeKnora │ └─ 中文优化、离线部署 → QAnything │ ├─ 我是开发者，要 SDK │ ├─ RAG-First、复杂检索 → LlamaIndex │ ├─ 通用 LLM 编排 → LangChain │ ├─ 生产级 Pipeline → Haystack │ └─ 自动调优 → DSPy + Ragas │ └─ 我要学 RAG ├─ 看技巧合集 → RAG_Techniques └─ 跑现成应用 → awesome-llm-apps

六、趋势判断：RAG 下半场

1. AgentRAG 是主战场

纯 RAG 已经不够了。RAGFlow 融合 Agent，WeKnora 内置 ReACT Agent，Dify 有工作流 + Agent——RAG + Agent 才是下半场。

2. 文档解析深度决定上限

“垃圾进，垃圾出”——RAG 的天花板不在检索算法，在文档解析。RAGFlow 的 DeepDoc、WeKnora 的多模态解析、LlamaIndex 的 LlamaParse，都在啃这块硬骨头。

3. 混合检索成为标配

单一向量检索覆盖不了所有场景。关键词 + 向量 + 图谱混合检索，已经是主流项目的共识。

4. 评估体系从"感觉还行"到"指标说话"

Ragas、DSPy 的崛起说明：RAG 不能只靠人肉体验评估，自动化评测 + 持续优化才是工程化正道。

七、WeKnora 在榜单中的位置

维度	WeKnora 的位置
Stars (~15k)	中等，但增长快（腾讯 2025 年底开源）
RAG 引擎排名	第二梯队头部，与 QAnything 同级
独特优势	混合检索三合一、ReACT Agent、腾讯生态（微信对话开放平台）
与其他项目差异	Go 语言后端（性能）、MCP 工具集成、多租户

一句话：WeKnora 不是 star 最多的，但在"企业级 RAG + Agent"这个交叉领域，功能完整度能打。特别是你同时用 OpenClaw + Hermes 的场景，WeKnora 的 MCP 集成和 API 优先设计，对接成本最低。

查看全文

http://www.jsqmd.com/news/865058/