当前位置：首页 > news >正文

一文讲清楚 Agent 权限怎么做：从最小权限到提示注入防护

news 2026/7/23 9:02:37

一文讲清楚 Agent 权限怎么做：从最小权限到提示注入防护

前言

AI Agent 真正麻烦的地方，不是“会不会回答问题”，而是它开始替人做事：读文件、查数据库、调用接口、发消息、改配置、跑命令，甚至触发支付、退款、部署、删除等高风险操作。

一旦 Agent 拥有工具调用能力，权限设计就不能再停留在“这个用户能不能访问某个页面”的传统思路上。因为 Agent 的执行链路更长：用户输入、模型理解、任务规划、工具选择、参数生成、外部系统执行、结果回传，每一步都可能被错误理解、提示注入、上下文污染或工具串联放大风险。

这篇文章系统讲清楚 Agent 权限怎么做：权限到底管什么、怎么分级、如何落地最小权限、什么时候需要人工确认、沙箱和审计应该放在哪一层，以及常见的工程误区。

文章目录

一文讲清楚 Agent 权限怎么做：从最小权限到提示注入防护
- 前言
- 一、为什么 Agent 权限不同于普通应用权限
- 二、Agent 权限到底要管哪些对象
- 三、核心原则：默认拒绝 + 最小权限
- 四、权限分级：从只读到高危执行
- 五、动态授权：不要把长期大权限交给 Agent
- 六、RBAC、ABAC 与 Agent 上下文策略
- 七、提示注入下的权限边界
- 八、沙箱隔离：把 Agent 关在可控范围内
- 九、凭证和敏感数据保护
- 十、人类审批：不要把所有责任交给模型
- 十一、审计日志：权限系统必须可追溯
- 十二、一个可落地的 Agent 权限架构
- 十三、工程落地清单
- - 1. 工具注册阶段
  - 2. 任务执行阶段
  - 3. 数据保护阶段
  - 4. 运行隔离阶段
  - 5. 观测与复盘阶段
- 十四、常见误区
- - 误区一：只要 Prompt 写好规则就安全
  - 误区二：Agent 用的是用户账号，所以出了事就是用户授权
  - 误区三：内部系统就不用做权限
  - 误区四：审批越多越安全
  - 误区五：只控制单个工具，不控制工具组合
- 十五、总结

一、为什么 Agent 权限不同于普通应用权限

传统应用的权限模型通常围绕“人”和“资源”展开：某个用户是否能查看订单、编辑文档、删除记录。系统的交互路径相对固定，按钮、接口、页面流程都是开发者事先设计好的。

Agent 不一样。Agent 的特点是：

执行路径动态生成：模型会根据任务临时规划步骤，不一定走固定流程。
工具组合不可完全预枚举：先读文件、再总结、再发消息，看似合理；但如果文件里有敏感信息，就可能变成泄露链路。
输入可能不可信：网页、邮件、聊天记录、文档内容都可能包含提示注入，诱导 Agent 忽略规则或调用危险工具。
权限主体更复杂：不是只有“人”，还有 Agent、子 Agent、工具、插件、服务账号、MCP Server、自动化工作流。
错误影响更直接：普通聊天答错了是内容问题；Agent 调错工具可能造成数据删除、消息误发、配置损坏或资损。

所以 Agent 权限的目标不是简单地“让它能做更多事”，而是在能力、效率和风险之间建立一套可控边界。

二、Agent 权限到底要管哪些对象

做权限设计前，先要把 Agent 可能接触的能力拆开。很多系统出问题，不是因为没有权限，而是把所有能力都粗暴地打包成一个“管理员 Token”交给 Agent。

常见权限对象包括：

权限对象	典型能力	主要风险
工具权限	调用搜索、数据库、邮件、工单、代码执行等工具	工具被误用或串联越权
数据权限	读取用户资料、业务数据、日志、知识库	敏感数据泄露、跨租户访问
文件权限	读写本地文件、上传下载附件	覆盖文件、读取密钥、外传隐私
网络权限	访问外部 URL、调用第三方 API	SSRF、数据外传、访问恶意地址
消息权限	发飞书、邮件、短信、Webhook	误发、冒充用户、对外承诺
系统权限	执行 Shell、改配置、重启服务	服务中断、破坏环境、提权
交易权限	支付、退款、下单、转账	直接资金损失
身份权限	使用用户 OAuth、服务账号、API Key	权限继承过大、难以追责

一个成熟的 Agent 系统，应该对这些对象分别建模，而不是只做一个“是否允许工具调用”的总开关。

三、核心原则：默认拒绝 + 最小权限

Agent 权限设计的第一条原则是：默认拒绝，按任务授予最小权限。

默认拒绝意味着：如果系统没有明确允许某个动作，Agent 就不能执行。不要让模型自己判断“这个应该没问题”。模型可以提出请求，但授权应该由策略、上下文和人类确认共同决定。

最小权限意味着：只给当前任务必需的能力，且范围越小越好。

举几个例子：

写技术文章时，Agent 可能需要联网搜索和创建文档，但不需要删除文件。
分析日志时，Agent 只需要读取某个时间段的脱敏日志，不应该拥有整个生产数据库权限。
帮用户发会议纪要时，可以允许向指定群发送一条确认过的消息，不应该获得任意群聊发言权限。
自动修复代码时，可以允许修改当前工作区文件，不应该默认读取~/.ssh、云厂商密钥或浏览器 Cookie。

最小权限不是一句口号，而是要落实到工具、资源、参数、时间、次数、网络目标和审批条件上。

四、权限分级：从只读到高危执行

工程上建议把 Agent 动作分成几个风险等级，不同等级走不同的授权流程。

等级	动作类型	示例	推荐处理
L0	无外部影响	纯文本总结、代码解释、方案设计	可直接执行
L1	只读查询	搜索网页、读取公开文档、查询非敏感状态	记录日志，可自动执行
L2	低风险写入	创建草稿、生成临时文件、写入工作区新文件	限定范围，可自动或弱确认
L3	可见外部动作	发消息、创建日程、上传文件、评论文档	需要确认对象和内容
L4	破坏性或敏感动作	删除、覆盖、改配置、重启服务、导出敏感数据	强制人工确认、可回滚
L5	资金/法律/安全关键动作	支付、退款、签约、权限提升、生产变更	多因素审批、分权执行

注意：风险等级不是由工具名字单独决定的，而是由“工具 + 参数 + 数据 + 上下文”共同决定。

例如，同样是“发送消息”：

给自己发一条提醒，风险较低；
以用户身份给客户发报价，风险很高；
在群里承诺合同条款，可能涉及法律风险。

所以权限系统必须理解上下文，而不能只写死“send_message = allow”。

五、动态授权：不要把长期大权限交给 Agent

Agent 权限最容易踩的坑，是为了省事给它一个长期有效、权限很大的 Token。短期看效率高，长期看风险非常大：一旦提示注入、插件漏洞或日志泄露发生，攻击面会被无限放大。

更合理的方式是动态授权，也可以理解为 JIT（Just-in-Time）权限：

Agent 根据任务提出动作请求；
权限策略引擎判断动作风险；
系统只为本次动作签发短期、窄范围凭证；
动作完成后凭证过期或回收；
全链路写入审计日志。

比如 Agent 需要读取某个项目的错误日志，不应该拿到整个日志平台管理员权限，而应该拿到一个类似这样的临时授权：

{"agent_id":"agent-doc-helper","scope":["log:read"],"resource":"project/payment-service","time_range":"2026-06-04T09:00:00+08:00/2026-06-04T10:00:00+08:00","expire_in":"10m"}