从RAG到Agentic RAG:Spring AI四层演进实战指南
你是否已经搭好了RAG系统,却发现面对“帮我改地址”“查一下退换货进度”这类任务时,AI只会“很抱歉,我无法访问您的账户”?本文提供一条清晰的渐进式演进路径,从L1基础RAG出发,逐层升级到具备工具调用、多步推理和状态恢复能力的Agentic RAG——你不会读到泛泛的概念,每一层都有可运行的Java代码。
一、为什么需要逐层演进?
一个常见误区是直接跳到Agent模式:把所有工具一股脑交给LLM,期望它自主决策。结果往往是一团乱麻——数据库写入发生在读取之前、工具调用陷入无限循环,或者干脆什么都不做。
更靠谱的策略:从RAG出发,逐层添加能力,每完成一层就验证一步。
| 层级 | 核心能力 | 主要技术 | 关键价值 |
|---|---|---|---|
| L1 基础RAG | 向量检索 + LLM生成 | Milvus + ChatClient | 让AI能“查”知识库 |
| L2 增强RAG | 对话记忆 + 语义缓存 + 元数据过滤 | Advisors系列 + Filter | 让AI能“记住”并“过滤” |
