当前位置: 首页 > news >正文

ragflow v0.25.2 发布:全面 REST 化、删除文件同步升级、权限与性能大修,老接口继续兼容



RAGFlow v0.25.2 已于 2026 年 5 月 10 日发布。这一版本的关键词非常明确:API 继续统一、数据源删除同步能力增强、权限控制更严格、性能瓶颈被修复、兼容性持续维护。如果你正在关注 RAGFlow 的升级节奏,v0.25.2 是一次覆盖面非常广的版本更新,既有架构层面的持续演进,也有大量面向生产可用性的修补与增强。


一、v0.25.2 版本总览

本次版本主要分为三大方向:

1)API 继续重构与统一

RAGFlow 持续推进 Web API 向 RESTful 规范迁移,同时强调保持旧接口兼容。这意味着新旧客户端在迁移过程中不会被强制打断,整体升级更平滑。

2)数据源删除文件同步能力增强

本次新增了一个轻量级 snapshot 机制,用于同步多个数据源中的已删除文件,并尽可能真实反映远端数据源状态。该能力覆盖多个数据源,说明 RAGFlow 在“同步一致性”方面进一步强化。

3)大量 bug 修复与安全/性能提升

从元数据可见性问题、重复 chat 输出、过滤性能瓶颈,到权限检查、兼容性路由、导出下载、数据集访问控制等,本次版本对生产环境中的关键问题做了系统性修正。


二、核心改进:API 统一继续推进,旧接口保持兼容

v0.25.2 延续了前几个版本的方向:Web API 向 RESTful 风格持续重构和统一。这类改动通常意味着:

  • 路由命名更统一
  • 资源表达方式更清晰
  • 接口层次更适合长期维护
  • 客户端调用体验更一致

更重要的是,本次更新特别强调了一个原则:所有 legacy 端点都保持向后兼容。也就是说,虽然内部接口正在逐步规范化,但旧版本的调用方式仍然可用。这对于正在使用 RAGFlow 的团队非常关键,因为它降低了升级风险,也减少了迁移成本。

这次还出现了多个与 RESTful 重构相关的更新点,例如:

  • 文档预览/下载迁移到 RESTful API
  • 文档下载增加兼容路由
  • 完整的旧文档 API 向后兼容维护
  • 路由名称调整
  • legacy 系统健康检查路由保留

这说明 RAGFlow 并不是简单地“换接口”,而是在做一套渐进式 API 重构:新规范逐步落地,老调用继续可用,保证系统演进不中断。


三、数据源同步重大升级:删除文件同步机制上线

本次最值得关注的功能之一,是轻量级 snapshot 机制的引入。它的目的很明确:用于同步远端数据源中被删除的文件,从而让本地状态更忠实地反映远端真实变化。

这项能力覆盖了多个数据源,包括:

  • Moodle
  • DingTalk AI Table
  • RSS
  • WebDAV
  • Asana
  • Zendesk
  • IMAP
  • Seafile

以及本次还扩展到:

  • dingtalk-ai-table
  • moodle
  • rss
  • webdav
  • asana
  • zendesk
  • seafile
  • rdbms

从更新描述看,这不是单点修补,而是一次跨数据源的能力扩展。它解决的是同步系统中非常现实的问题:远端数据源删了文件,本地如果不知道,就会产生脏数据、误检索、误展示、甚至误引用

这个机制带来的直接价值

  • 删除内容能够被更及时识别
  • 数据源状态更一致
  • 检索结果更可靠
  • 数据同步更贴近真实远端状态
  • 后续文档管理与权限控制更容易保持正确性

此外,这次更新中还包含了多个与同步相关的修复:

  • 数据源空列表同步修复
  • 文件批量删除优化
  • 文档删除权限检查补充
  • 删除文档 UUID 校验移除
  • 连接器服务时间设置与日志间隔修正
  • 同步文档 ID 按连接器作用域隔离,避免跨知识库冲突

可以看出,v0.25.2 不只是“支持删除同步”,而是顺手把整条同步链路的稳定性、隔离性、正确性都加强了一遍。


四、性能优化:元数据过滤从内存处理下沉到 Elasticsearch

这次版本里有一个非常明确的性能改进点:元数据过滤不再在内存中处理,而是下推到 Elasticsearch

这项优化非常重要,因为内存过滤通常会带来以下问题:

  • 数据量大时性能明显下降
  • 过滤逻辑难以扩展
  • 会产生额外的内存开销
  • 检索链路容易出现瓶颈

本次改动后,过滤逻辑交给 Elasticsearch 执行,说明系统更合理地利用了检索引擎能力。对于大规模数据集场景,这种优化往往能带来非常明显的收益。

除此之外,性能类修复还包括:

  • 避免 embedding 累积中的 O(n²) 数组增长
  • RocksDB 元数据并发 CREATE/DROP 冲突重试
  • 图谱构建中的合并并发和 checkpoint 恢复
  • 文件批量删除优化
  • 任务日志数量上限放宽
  • 继续优化数据过滤与检索链路

这些变化表明,v0.25.2 不只是修小 bug,而是在处理大数据量、大并发环境下的真实使用问题


五、聊天与多模态能力增强

本次在 chat 体验方面也有较多更新:

  • 简化 chat,并支持多模态 chat
  • 支持多模态 chat 流式输出
  • 修复聊天页面 LaTeX 公式无法显示
  • 修复双重转义的 LaTeX 反斜杠和 HTML 实体
  • 修复重复 chat 输出
  • 修复非流式工具调用追加到 chat history 的异常
  • 修复对话中的思考显示折叠与深度研究检索标签分离
  • 修复聊天页中书写公式显示问题
  • 修复部分输出与消息展示错误

这些修复说明 RAGFlow 在对话层的目标并不是只做“能聊”,而是进一步让复杂能力在前端表现上保持稳定。例如:

  • 公式内容能正确渲染
  • 多模态请求可流式返回
  • 工具调用历史更稳定
  • deep research 的展示标签更清晰
  • 聊天输出重复问题被处理

这类体验修复对最终用户感知非常明显,尤其是在知识问答、文档分析、多模态辅助场景里。


六、权限控制全面收紧:多处接口补上授权检查

v0.25.2 在安全性方面非常明显的一点,就是权限检查更严格了。多个接口都补上了 tenant 级别的授权控制或 IDOR 防护,避免越权访问和跨租户泄露。

本次涉及的安全与权限修复包括:

  • 文档删除权限检查
  • beta 文档下载授权检查
  • 文档下载 endpoint 加强租户授权
  • chatbot SDK endpoint 强制 tenant 级授权
  • memory 与 message endpoint 强制 tenant 权限
  • 文件 ancestry 接口补权限检查
  • /files/link-to-datasets 授权缺失修复
  • 私有数据集访问检查中的越权修复
  • agent 权限问题修复及回滚
  • team member 无法编辑 agent 的修复
  • hybrid 模式下认证问题修复
  • CLI 登录、注册、注销相关修复
  • document download 兼容路由同时保留授权逻辑

这些修复共同指向一个目标:多租户环境下的数据隔离必须严格。这对于企业部署尤其重要,因为一旦权限边界不清晰,就可能造成数据泄露或者误操作。


七、模型与推理能力持续扩展:更多 provider 接入

v0.25.2 中,模型接入能力继续扩展,新增或完善了多个 provider 支持,包括:

  • FuturMix
  • Vllm
  • Ollama
  • xAI
  • lm-studio
  • OpenAI
  • Nvidia
  • OpenRouter
  • HuggingFace
  • 阿里云相关能力
  • ZhipuAI 的 Rerank
  • Gitee AI 的 Rerank
  • SiliconFlow 的 Balance
  • DeepSeek 的 Balance
  • Aliyun 的 Encode(embeddings)
  • Bedrock 相关修正
  • MiniMax GroupId header 支持
  • 继续优化 model service 的统一调用逻辑

同时还有以下相关改进:

  • 使用统一的 GetChatModel,减少重复函数
  • 修正 IMAGE2TEXT 到 CHAT 的 fallback 与 model_type 归一化
  • 修复本地模型连接检查的全局状态污染
  • 修复不同 provider 的 ListModels 和 CheckConnection 接口对接
  • 修复 agent completion 的兼容性
  • 支持 non-stream runtime agent completion

这意味着 RAGFlow 的模型生态继续变宽,同时内部调用链也在变得更统一、更可维护。


八、数据集、文档、检索与 RAG 相关修复

围绕数据集与文档的修复非常多,覆盖面很广:

  • 允许搜索多个数据集
  • 修复数据集文件页面路由错误
  • 修复数据集文件过滤 API
  • 修复 document api 的向后兼容
  • 修复知识库 prompt 中 document_metadata 为空导致的 citation 崩溃
  • 修复 tag parser id
  • 修复 handle id as keyword
  • 修复 kb_ids 在 SQL 拼接前的 UUID 校验
  • 修复文档导出元数据丢失
  • 修复文档生成器输出补充 base64
  • 修复文档转换的向后兼容
  • 修复过滤条件下 rerank 不应绕过阈值
  • 修复嵌入模型切换后已有 chunks 的恢复问题
  • 修复 shared dataset 访问时的私有数据集授权绕过
  • 修复 file ancestry 相关越权
  • 修复 dataset search 多数据集 UI
  • 修复删除 last file 的问题
  • 修复 sync 中 document IDs 按 connector 作用域隔离
  • 修复 filter api 在 dataset document 中的行为

这些更新集中体现了 RAGFlow 的核心定位:文档检索、数据集管理、RAG 召回、rerank、导出、转换、权限控制必须形成闭环。任何一个环节不稳定,最终都会影响问答、引用和业务结果。


九、开发者与 CLI 能力增强

本次版本也强化了 Go 相关能力与 CLI 工具链,包括:

  • CLI 支持 text、image、video 聊天
  • CLI 登录修复
  • CLI 注册修复
  • CLI 注销修复
  • Go CLI 支持数据集搜索
  • Go CLI 支持 embed 和 rerank
  • Go 管理 ingestion tasks
  • Go 侧日志模块迁移到 common
  • Go 侧 auth 修复
  • Go 侧 provider 实现持续扩展

这些内容说明 RAGFlow 不只是 Web 产品,也在持续建设命令行和程序化使用能力,方便自动化、调试和运维集成。


十、其他值得关注的细节修复

除了上面的大方向,这次版本还有不少细节修复,同样影响生产稳定性:

  • 版本信息修复
  • 任务日志更多展示
  • 路由名称调整
  • 树形图/画布运行路径感知修复
  • 文档预览下载元数据保留
  • 兼容历史健康检查路由
  • 支持 local provider 的代码执行组件
  • 去除部分过时模型
  • Turkish 本地化字符串更新
  • SSL 证书配置指南补充
  • README 与版本引用更新
  • release notes 和发布时间同步修正
  • docs 全面更新到 v0.25.2

这些内容虽然看起来零散,但它们是成熟产品持续迭代中非常重要的一部分:让系统更稳定、文档更准确、升级更顺畅、运维更友好


十一、v0.25.2 的整体意义

如果把这次更新浓缩成一句话,那就是:

RAGFlow v0.25.2 是一次以兼容性为前提、以稳定性和安全性为重点、以同步与检索性能优化为亮点的综合升级。

它没有只做单一功能,而是同时推进了:

  • REST API 统一
  • 删除文件同步
  • 多数据源一致性
  • 权限与安全
  • 检索性能
  • 多模态聊天
  • 模型 provider 扩展
  • CLI 与 Go 侧增强
  • 向后兼容维护

这类版本通常最适合生产环境关注,因为它解决的不是表面功能,而是实际落地中的关键痛点。


十二、总结

代码地址:github.com/infiniflow/ragflow

RAGFlow v0.25.2 这次更新内容非常密集,覆盖范围也非常广。从 API 重构到数据源删除同步,从元数据过滤性能到聊天展示修复,从租户权限到多 provider 支持,再到 CLI 与 Go 侧完善,几乎可以说是一次“全栈型”的版本升级。

http://www.jsqmd.com/news/793743/

相关文章:

  • 通过Taotoken CLI工具一键配置团队所有成员的开发环境
  • AI泡沫,会被什么戳破?
  • Bibata光标主题:跨平台高DPI解决方案与深度定制指南
  • LinkSwift:一键获取九大网盘直链下载地址的终极解决方案
  • HDOJ实战入门:从零到一攻克在线评测系统
  • AI知识库构建实战:从RAG原理到工程化实现
  • 游标分页原理与SQLAlchemy集成实战:解决动态数据分页难题
  • 基于Git日志与AI的开发者行为画像分析工具设计与实现
  • 家庭Kubernetes场景下的Helm Chart优化实践与部署指南
  • 别再只盯着聊天了!用网易云信+音视频SDK,30天搭建一个在线问诊App原型
  • 网络中心性(Centrality)选型指南:从业务问题出发的指标匹配方法
  • ARM架构TTBR0_EL1寄存器详解与内存管理优化
  • Arm CoreSight CTI寄存器架构与调试技术详解
  • Godot任务系统设计:数据驱动与事件驱动的游戏任务框架
  • App安全测试实战:OWASP ZAP 2.8 代理配置进阶与场景化应用
  • 三周掌握大语言模型:从Transformer原理到ChatGPT实战应用
  • 手把手教你配置H3C S5130交换机IRF堆叠,附10G光口连线图与完整配置备份
  • KV缓存压缩技术:IsoQuant在大语言模型中的应用
  • PIC16F84A实现多功能逻辑分析仪与频率计数器设计
  • AI大模型选型指南:构建开源比较平台的技术实践与架构解析
  • 极简终端AI聊天工具gptcli:单文件Python脚本实现OpenAI API兼容客户端
  • 509-qwen3.5-9b csdn tmux
  • [Deep Agents:LangChain的Agent Harness-07]利用PatchToolCallsMiddleware修复错乱的消息结构
  • repobase:现代项目脚手架,统一工程化配置提升开发效率
  • 别再手动审批了!用Flowable 6.3.0 + Spring Boot 3分钟搭建一个请假审批微服务
  • Arm CoreSight DAP寄存器架构与调试技术详解
  • 告别环境配置噩梦:用Shell脚本一键搞定VCS与Verdi的联调环境
  • 多智能体协同AI Coding:Multica、vibe-kanban、Maestro、OpenCove
  • 3步掌握Video2X:AI视频画质增强与流畅度提升终极指南
  • Go格式化输出实战:从Printf到Fprintf的精准控制与场景应用