71.人工智能实战:RAG 权限过滤怎么做?从前期发现“越权召回”到文档 ACL、检索过滤与引用权限校验
人工智能实战:RAG 权限过滤怎么做?从前期发现“越权召回”到文档 ACL、检索过滤与引用权限校验
一、问题场景:AI 没有直接泄露权限,但检索已经越界了
企业级 RAG 系统上线后,最危险的问题之一不是“答错”,而是:
用户问了一个正常问题,但系统召回了他不该看到的资料。例如企业内部知识库里有三类文档:
1. 普通员工制度 2. 销售部门制度 3. 财务审计制度普通员工问:
差旅报销标准是多少?如果检索阶段没有权限过滤,系统可能把财务审计制度也召回进上下文。
即使模型最后没有完整输出财务制度内容,这个风险依然存在:
无权限资料已经进入 Prompt。我遇到过一次真实问题。
业务系统接入了 RAG,文档入库时只保存了:
doc_id content embedding没有保存 ACL 权限。
后续上线后,用户反馈:
