RAGFlow 系列教程 第二十九课:性能优化与生产最佳实践
系列: RAGFlow v0.25.0 源码深度解析
作者: 耿雨飞
前置知识: 已完成第二十八课"Agent 工作流开发实战"的学习
导读
在前面的课程中,我们已经深入了解了 RAGFlow 的文档解析、分块、检索、LLM 集成、Agent 工作流等核心功能。然而,将 RAG 系统从"能用"推向"好用",关键在于性能优化。一个回答慢、检索不准、吞吐量低的 RAG 系统,在生产环境中几乎无法提供价值。
那么,RAG 系统的质量到底由哪些因素决定?性能瓶颈通常出现在哪里?RAGFlow 又提供了哪些可调参数和优化手段?
答案分布在三个层面:分块策略决定了知识的粒度和质量,检索调优决定了召回的准确性和排序效果,系统级优化则决定了整体吞吐量和响应延迟。本课将从源码角度逐一剖析这三个层面的优化手段,帮助你在生产环境中最大化 RAGFlow 的效能。
学习目标
- 理解 RAG 系统质量的核心影响因素:分块粒度、Embedding 表示能力、检索权重配置、Rerank 模型
- 掌握 TokenChunker 的
chunk_token_size/overlapped_percent参数调优逻辑 - 理解 TitleChunker 的层级分块(Hierarchy)与分组分块(G
