RAGFlow0.25版本更新与记忆工作流简介
RAGFlow0.25版本更新与记忆工作流简介
全文链接:RAGFlow0.25版本更新与记忆工作流简介
本文归纳RAGFlow自v0.20.0起至v0.25.0区间在官方发布说明中的主要功能与重大变更,并单独说明Memory(记忆)模块的定位、配置要点与可落地的 Agent 工作流(含文字箭头流程图)。具体子版本与修复项繁多,以官方 Release notes 与各版本 GitHub Release为准;升级前务必阅读对应版本的Breaking changes / 数据库迁移说明。
目录
- 一、信息来源与版本跨度
- 二、按版本的功能速览(0.20.x~0.25.0)
- 三、重大更新归纳
- 四、Memory 模块:做什么、怎么配
- 五、记忆功能工作流示例与流程图
- 六、升级与排障提示
- 七、参考链接
一、信息来源与版本跨度
- 官方 Release notes:Releases | RAGFlow
- GitHub 标签页:infiniflow/ragflow Releases
- Memory 使用说明:Use memory | RAGFlow
本文讨论的「0.20.0 到 0.25.0 之间」包含0.20.x 补丁线与0.21.0~0.25.0的主线功能;0.20.0本身是一次Agent 体系大改版的起点,后文会单独强调。
二、按版本的功能速览(0.20.x~0.25.0)
| 版本 | 发布时间(以官方为准) | 功能与变更摘要 |
|---|---|---|
| v0.20.0 | 2025-08-04 | 兼容性:旧版 Agent不再兼容,升级后需重建。新能力:Agent 与 Workflow统一编排、Agent大重构(多 Agent、规划与反思、可视化)、MCP 全链路、运行时日志、聊天历史管理、新版Infinity与自动打标签等。 |
| v0.20.1~0.20.5 | 2025-08~09 | 多为Agent/检索/模板/模型增补与修复;如Retrieve chunks增加metadata_condition、动态指定数据集、框架级 System prompt 块、GraphRAG 超时等(详见各版 release)。 |
| v0.21.0 | 2025-10-15 | 可编排入库流水线(Ingestion pipeline)、GraphRAG/RAPTOR改为手动批量构建、长上下文 RAG(文档级 TOC 模板)、视频解析、Admin CLI、新模板与Infinity v0.6.0等。 |
| v0.21.1 | 2025-10-23 | MinerU 解析 PDF(实验性)、Infinityv0.6.1、数据集与个人中心UI等。 |
| v0.22.0 | 2025-11-12 | Breaking:仅提供slim无嵌入镜像、不再用-slim后缀区分。新能力:多在线数据源同步(S3、Google Drive、Notion、Confluence、Discord)、RAPTOR可按整库或单文档构建、Agent结构化输出、Retrieval元数据过滤、Variable aggregator 等。 |
| v0.22.1 | 2025-11-19 | Flask 异步化、List operations / Variable aggregator、S3 兼容源、JIRA 同步、导出 Word/Markdown 等;修复-full版解析/换嵌入等问题。 |
| v0.23.0 | 2025-12-27 | Memory 管理界面上线;Retrieval / Message 可配置Memory 上下文;Agent架构优化、Webhook、语音、单 Agent多 Retrieval;入库流水线Transformer 支持TOC;父子分块、解析时自动生成元数据;GraphRAG 加速;Infinity v0.6.15;大量数据源与模型扩展。 |
| v0.23.1 | 2025-12-31 | Memory 全类型抽取稳定性;空 Memory 导致无法启动、无法删除等修复;MDX、GitHub/GitLab/Asana/IMAP 等数据源相关项。 |
| v0.24.0 | 2026-02-10 | Memory 管理 API(HTTP + Python)、抽取日志输出控制台;批量元数据、PageIndex(原 ToC 命名调整);类 Chat 的 Agent 会话管理;多 Sandbox(本地 gVisor / 阿里云等);ChatThinking模式、深度检索优化;OceanBase作 MySQL 替代;新模型与数据源等。 |
| v0.25.0 | 2026-04-21(GitHub) | 入库流水线:7 套内置模板、解析增强;数据源:Seafile、RSS、钉钉 AI 表格等及删除同步;Agent 发布、沙箱内代码执行与图表、数据分析 Agent模板;用户级 Memory存储与检索(发布说明表述);移动端嵌入页;默认MinIO镜像调整;数据库升级脚本;DocEngine 支持Elasticsearch 9.x;新模型与厂商;与OpenClaw等生态说明等。 |
三、重大更新归纳
下列条目在产品形态、部署或研发集成上影响面较大,可视为「重大」或需重点阅读发行说明的更新(非严格排名)。
v0.20.0:Agent/Workflow 统一与 MCP
- 与旧版Agent 不兼容、必须重建;统一编排 + MCP 全链路,相当于平台代际切换。
v0.21.0:可编排入库 + GraphRAG/RAPTOR 构建方式 + 长文 TOC
- 数据进入知识库的方式产品化;长文档 RAG 通过TOC/PageIndex思路缓解切块带来的上下文丢失。
v0.22.0:Docker 发行策略 Breaking + 在线数据源 + RAPTOR 粒度
- 部署镜像策略变化影响所有依赖 full 镜像习惯的用户;云同步与RAPTOR 按库/按文档扩展了运维与知识工程选项。
v0.23.0:Memory 首版 + Agent 能力面(Webhook、语音、多 Retrieval)+ 入库流水线与分块
- 记忆与Agent 编排进入可配置闭环;与后续API形成前后衔接。
v0.24.0:Memory API + 多 Sandbox + Agent 会话体验
- 程序化管理记忆、隔离执行环境、会话与「思考」模式等,偏向企业落地与可观测性。
v0.25.0:Agent 发布、流水线模板强化、用户级 Memory、DB 升级与生态
- 对外发布 Agent、数据分析模板、用户级记忆与DB 迁移脚本等,对生产发布与升级路径要求高。
说明:v0.25.0 在 GitHub Release 正文中另有Memory API 网关/服务分层、安全相关修复等大量 PR,运维与安全团队宜对照完整 changelog评估。
四、Memory 模块:做什么、怎么配
根据官方 Use memory:
- 定位:在 Agent 运行过程中持久化对话与衍生信息(摘要、笔记等),并把内容整理为不同类型,使后续对话能召回用户事实、经历与任务上下文,减少重复与跑题。
- 类型(创建时可勾选抽取维度):
- Raw:原始对话(默认必需)。
- Semantic Memory:与用户/世界相关的事实与常识性条目。
- Episodic Memory:带时间色彩的事件与经历记录。
- Procedural Memory:技能、习惯、流程化经验。
创建与配置路径:Overview → Memory中新建;在某一 Memory 的Configuration中设置:
| 配置项 | 含义 |
|---|---|
| Name | 唯一名称。 |
| Embedding model | 将记忆条目向量化所用嵌入模型。 |
| LLM | 从原始对话中抽取与整理记忆所用对话模型。 |
| Memory type | 勾选要抽取的类型(见上)。 |
| Memory size | 默认约5MB(官方给出与 embedding 维度的占用估算)。 |
| Permission | 仅本人或团队共享。 |
在 Agent 中启用(与检索闭环):
- Retrieval组件:配置为从指定Memory读取(与知识库检索并列,用于把历史记忆拉回上下文)。
- Message组件:配置Save to Memory,把本轮需沉淀的内容写入同一或指定 Memory。
官方强调:凡使用 Memory 的 Agent,通常需要配套 Retrieval 才能把记忆读回对话。
五、记忆功能工作流示例与流程图
以下三个示例均基于官方描述的「Retrieval 读 Memory + Message 写 Memory」模式;画布上具体节点名称以你当前RAGFlow UI为准。
5.1 示例一:客服机器人「越聊越懂你」
业务目标:用户多次咨询退换货政策;系统记住已核实过的订单号、偏好渠道,避免用户重复输入。
用户发消息 → Message 节点(对话模型回复) → 分支:若本轮包含可沉淀事实(订单号、结论) → Message「Save to Memory」写入 Memory-A → 下一轮用户再问 → Retrieval(知识库 + Memory-A)并行或串行召回 → Message 生成回答(带记忆上下文)文字要点:首次对话写入Episodic / Semantic;后续Retrieval同时命中FAQ 知识库与Memory-A中的订单事实。
5.2 示例二:内部知识助手 + 会议结论沉淀
业务目标:检索公司制度(数据集)同时,把每次会议结论写入团队共享 Memory。
开始(用户提问) → Retrieval-1:数据集「制度库」 → Retrieval-2:Memory「团队纪要」(Permission=Team) → 合并上下文 → LLM 回答 → 若用户指令「记录本次会议结论」 → Message → Save to Memory「团队纪要」流程图(箭头):
[用户输入] ↓ [Retrieval: 制度数据集] ↓ [Retrieval: 团队 Memory] ──→ [合并上下文] ↓ ↓ [LLM 生成答复] ←───────────────────┘ ↓ [用户确认「写入纪要」] ↓ [Message: Save to Memory] ↓ [Memory 条目更新,供下次 Retrieval]5.3 示例三:仅「读记忆」的只读助手(不写回)
业务目标:上线前只想用已有 Memory 做个性化,不允许自动写入。
[用户输入] ↓ [Retrieval: Memory-B(只读)] ↓ [Retrieval: 业务知识库] ↓ [LLM] ↓ [结束] (不在 Message 上配置 Save to Memory)适用于记忆由管理员人工整理导入或仅消费历史会话导出的场景。
5.4 运维与治理(与版本相关)
- v0.23.1起修复了「空 Memory 导致服务起不来」「空 Memory 删不掉」等问题;生产环境应避免创建无配置的空 Memory,并定期在 Memory 管理页清理/遗忘条目(官方说明:手动遗忘的条目不再参与 Agent 召回)。
- v0.24.0起可通过HTTP/Python API做记忆管理自动化(具体路径见 HTTP API reference 与 Python 文档)。
- v0.25.0发布说明提到用户级 Memory与Memory API 分层重构;集成方需关注接口路径或网关行为是否与旧版一致,以当前文档为准。
六、升级与排障提示
- 跨 0.20.0:旧 Agent必须重建;若有历史工作流,需按官方迁移说明重做。
- 跨 0.22.0:Docker仅 slim、无嵌入镜像策略变化;依赖
-full内置嵌入的环境需改部署方式。 - 跨 0.25.0:关注数据库升级脚本、默认 MinIO 镜像变更、Elasticsearch 9.x等与运维相关的条目。
- Memory:升级后若遇抽取失败或 API 404,先查Release notes中 Memory 相关修复版本,并对照Use memory与Share memory文档检查权限与 Retrieval/Message 绑定。
七、参考链接
- RAGFlow Release notes(官方)
- RAGFlow Changelog
- infiniflow/ragflow Releases(GitHub)
- Use memory | RAGFlow
- Retrieval 组件说明
- Message 组件(Agent 组件参考)
- HTTP API Reference
- v0.25.0 Release(GitHub)
- Share memory | RAGFlow
文档与界面随版本迭代,若链接锚点变更,请从 RAGFlow 文档首页重新导航。
