数据来源:GitHub Stars 排行榜、gh-spy 扫描、多源交叉验证。Stars 为近似值,实时数据以 GitHub 为准。
文章目录
- 一、总榜 Top 15(按 GitHub Stars 排序)
- 二、按定位分类——别只看 Stars,看类型
- 🔧 类型 A:RAG 专用引擎(就是做 RAG 的)
- 🏗️ 类型 B:全栈 AI 平台(RAG 是功能之一)
- 🧩 类型 C:RAG 开发框架(给开发者用的 SDK)
- 📚 类型 D:教育资源(学 RAG 用的)
- 三、关键维度对比
- 四、活跃度与维护健康度
- 五、选型决策树
- 六、趋势判断:RAG 下半场
- 1. AgentRAG 是主战场
- 2. 文档解析深度决定上限
- 3. 混合检索成为标配
- 4. 评估体系从"感觉还行"到"指标说话"
- 七、WeKnora 在榜单中的位置
一、总榜 Top 15(按 GitHub Stars 排序)
| 排名 | 项目 | ⭐ Stars | 语言 | 定位 | 维护状态 |
|---|
| 1 | Dify | ~141k | TypeScript / Python | 低代码 AI 应用平台(含 RAG 引擎) | 🟢 极度活跃 |
| 2 | Open WebUI | ~137k | Python | 用户友好的 AI 界面(Ollama + OpenAI) | 🟢 活跃 |
| 3 | LangChain | ~137k | Python / JS | 通用 LLM 编排框架(RAG 是子集) | 🟢 极度活跃 |
| 4 | awesome-llm-apps | ~110k | Python | 100+ 可运行 AI Agent & RAG 应用合集 | 🟡 教程型 |
| 5 | RAGFlow | ~80k | Python | 专注 RAG 引擎 + Agent,深度文档理解 | 🟢 极度活跃 |
| 6 | Anything-LLM | ~60k | JavaScript | 多合一 AI 生产力工具,隐私优先 | 🟢 活跃 |
| 7 | LlamaIndex | ~40k | Python / JS | RAG-First 数据框架,检索最强 | 🟢 活跃 |
| 8 | LightRAG | ~35k | Python | 港大出品,轻量快速 RAG(EMNLP 2025) | 🟢 活跃 |
| 9 | GraphRAG | ~33k | Python | 微软出品,知识图谱驱动的 RAG | 🔴 降温(月提交 3) |
| 10 | RAG_Techniques | ~27k | Python | RAG 高级技巧合集 + Notebook 教程 | 🟡 教程型 |
| 11 | FastGPT | ~23k | TypeScript | 工作流 + 知识库,国产低代码平台 | 🟢 活跃 |
| 12 | Haystack | ~20k | Python | 生产级 Pipeline 架构,企业首选 | 🟢 活跃 |
| 13 | QAnything | ~13k | Python | 网易有道出品,BCEmbedding + Reranker | 🟡 中等 |
| 14 | WeKnora | ~15k | Go / Vue | 腾讯出品,文档理解 + 混合检索 + Agent | 🟢 活跃 |
| 15 | MaxKB | ~12k | Python | 开箱即用企业级 AI 智能体平台 | 🟢 活跃 |
二、按定位分类——别只看 Stars,看类型
Stars 多不等于"更好用"。Dify 141k star,但它是全栈 AI 平台,RAG 只是其中一个功能;RAGFlow 80k star,才是专注 RAG 的引擎。选项目先选类型。
🔧 类型 A:RAG 专用引擎(就是做 RAG 的)
| 项目 | Stars | 核心能力 | 适合谁 |
|---|
| RAGFlow | ~80k | DeepDoc 文档解析、OCR、布局识别、GraphRAG、Agentic RAG | 文档密集场景、需要深度解析 |
| LightRAG | ~35k | 轻量快速、图结构检索、EMNLP 论文加持 | 学术研究、快速原型 |
| GraphRAG | ~33k | 知识图谱驱动、跨文档关联发现 | 需要图谱推理的场景 |
| QAnything | ~13k | BCEmbedding 自研模型、Reranker、离线部署 | 中文场景、隐私优先 |
| WeKnora | ~15k | 混合检索(关键词+向量+图谱)、ReACT Agent、多租户 | 企业知识管理、需对接 Agent |
| R2R | ~8k | RESTful API、Agentic RAG | API 优先的集成场景 |
| Verba | ~8k | Weaviate 原生、轻量 | Weaviate 生态用户 |
🏗️ 类型 B:全栈 AI 平台(RAG 是功能之一)
| 项目 | Stars | RAG 能力 | 其他能力 | 适合谁 |
|---|
| Dify | ~141k | 内置知识库、混合检索、Q2Q 召回 | 工作流编排、Agent、多模型管理 | 企业级全场景 |
| FastGPT | ~23k | 知识库 + 工作流 | 可视化对话流、API 编排 | 中小团队快速搭建 |
| MaxKB | ~12k | 知识库问答 | 工作流、Agent、多模型 | 开箱即用型企业 |
| Anything-LLM | ~60k | 文档向量化 + 问答 | 多 LLM 支持、本地优先 | 个人 / 小团队 |
🧩 类型 C:RAG 开发框架(给开发者用的 SDK)
| 项目 | Stars | 核心抽象 | 适合谁 |
|---|
| LangChain | ~137k | Chain / Agent / Retriever | 通用 LLM 开发、灵活编排 |
| LlamaIndex | ~40k | Index(向量/关键词/图谱/树) | RAG-First、复杂检索模式 |
| Haystack | ~20k | Pipeline(有向图组件) | 生产级、企业部署 |
| DSPy | ~10k | Signature + Optimizer | 自动化调优、标注数据驱动 |
| Ragas | ~8k | 评估指标(Faithfulness / Relevancy) | RAG 质量评估 |
📚 类型 D:教育资源(学 RAG 用的)
| 项目 | Stars | 内容 | 适合谁 |
|---|
| awesome-llm-apps | ~110k | 100+ 可运行 AI & RAG 应用 | 入门学习、找灵感 |
| RAG_Techniques | ~27k | RAG 高级技巧 + Notebook 教程 | 进阶学习、查方案 |
三、关键维度对比
检索策略
| 项目 | 纯向量 | 关键词(BM25) | 知识图谱 | 混合检索 |
|---|
| RAGFlow | ✅ | ✅ | ✅(GraphRAG) | ✅ |
| WeKnora | ✅ | ✅ | ✅ | ✅ |
| LightRAG | ✅ | ❌ | ✅(图结构) | 部分 |
| GraphRAG | ❌ | ❌ | ✅(核心) | ❌ |
| Dify | ✅ | ✅ | ❌ | ✅ |
| LlamaIndex | ✅ | ✅ | ✅ | ✅ |
| QAnything | ✅ | ✅ | ❌ | ✅ |
部署难度
| 项目 | Docker 一键 | 本地免 Docker | 云端 SaaS | 私有化部署 |
|---|
| RAGFlow | ✅ | ❌ | ❌ | ✅ |
| Dify | ✅ | ❌ | ✅ | ✅ |
| WeKnora | ✅ | ✅(一键镜像) | ❌ | ✅ |
| Anything-LLM | ✅ | ✅ | ❌ | ✅ |
| FastGPT | ✅ | ❌ | ✅ | ✅ |
| QAnything | ✅ | ❌ | ❌ | ✅ |
文档解析能力
| 项目 | PDF | Word | 图片 OCR | 表格 | Markdown | HTML |
|---|
| RAGFlow | ✅ 深度 | ✅ | ✅ 强 | ✅ 强 | ✅ | ✅ |
| WeKnora | ✅ 深度 | ✅ | ✅ | ✅ | ✅ | ✅ |
| Dify | ✅ 基础 | ✅ | ⚠️ 有限 | ⚠️ 有限 | ✅ | ✅ |
| LlamaIndex | ✅(LlamaParse) | ✅ | ✅ | ✅ | ✅ | ✅ |
| QAnything | ✅ | ✅ | ✅ | ⚠️ | ✅ | ❌ |
四、活跃度与维护健康度
来自 gh-spy 扫描数据(RAG 专用引擎维度):
| 项目 | 月提交 | Open Issues | Issue 平均关闭天数 | 贡献者 | 健康评级 |
|---|
| RAGFlow | 338 | 3000+ | 33.6 天 | 463 | A/F/A/A(活跃但维护滞后) |
| LightRAG | 188 | 226 | 24.5 天 | 246 | A/D/A/A(活跃且较健康) |
| GraphRAG | 3 | — | 17.2 天 | 50 | D/D/B/A(降温但还在响应) |
| R2R | 0 | — | 29.9 天 | 61 | F/D/B/B(已停更) |
| Verba | 2 | — | 78.4 天 | 37 | D/F/B/B(大厂 Demo 模式) |
| AutoRAG | 0 | 149 | 524.5 天 | 26 | F/F/C/B(已停滞) |
三个关键洞察:
- RAGFlow 独占赛道 40% star——马太效应明显,但 3000+ open issues 说明增长快维护跟不上
- 大厂项目"发布后降温"定律——微软 GraphRAG(月提交 3)、NVIDIA ChatRTX(1 贡献者)、Weaviate Verba(月提交 2),无一例外降温
- 真正持续的是创业公司(RAGFlow/InfiniFlow)和学术团队(LightRAG/港大)
五、选型决策树
你的需求是什么? │ ├─ 我要开箱即用,不想写代码 │ ├─ 企业级全功能 → Dify │ ├─ 个人/小团队 → Anything-LLM │ └─ 中文知识库 → FastGPT / MaxKB │ ├─ 我要专注 RAG 引擎 │ ├─ 文档深度解析(OCR、表格、布局)→ RAGFlow / WeKnora │ ├─ 轻量快速、学术场景 → LightRAG │ ├─ 知识图谱推理 → GraphRAG / WeKnora │ └─ 中文优化、离线部署 → QAnything │ ├─ 我是开发者,要 SDK │ ├─ RAG-First、复杂检索 → LlamaIndex │ ├─ 通用 LLM 编排 → LangChain │ ├─ 生产级 Pipeline → Haystack │ └─ 自动调优 → DSPy + Ragas │ └─ 我要学 RAG ├─ 看技巧合集 → RAG_Techniques └─ 跑现成应用 → awesome-llm-apps
六、趋势判断:RAG 下半场
1. AgentRAG 是主战场
纯 RAG 已经不够了。RAGFlow 融合 Agent,WeKnora 内置 ReACT Agent,Dify 有工作流 + Agent——RAG + Agent 才是下半场。
2. 文档解析深度决定上限
“垃圾进,垃圾出”——RAG 的天花板不在检索算法,在文档解析。RAGFlow 的 DeepDoc、WeKnora 的多模态解析、LlamaIndex 的 LlamaParse,都在啃这块硬骨头。
3. 混合检索成为标配
单一向量检索覆盖不了所有场景。关键词 + 向量 + 图谱混合检索,已经是主流项目的共识。
4. 评估体系从"感觉还行"到"指标说话"
Ragas、DSPy 的崛起说明:RAG 不能只靠人肉体验评估,自动化评测 + 持续优化才是工程化正道。
七、WeKnora 在榜单中的位置
| 维度 | WeKnora 的位置 |
|---|
| Stars (~15k) | 中等,但增长快(腾讯 2025 年底开源) |
| RAG 引擎排名 | 第二梯队头部,与 QAnything 同级 |
| 独特优势 | 混合检索三合一、ReACT Agent、腾讯生态(微信对话开放平台) |
| 与其他项目差异 | Go 语言后端(性能)、MCP 工具集成、多租户 |
一句话:WeKnora 不是 star 最多的,但在"企业级 RAG + Agent"这个交叉领域,功能完整度能打。特别是你同时用 OpenClaw + Hermes 的场景,WeKnora 的 MCP 集成和 API 优先设计,对接成本最低。