当前位置：首页 > news >正文

系统级 Agent 命令白名单：让模型先申请，再执行

news 2026/7/3 7:34:10

系统级 Agent 命令白名单：让模型先申请，再执行

一、Agent 自动执行命令最需要刹车

AI Agent 能读取文件、运行测试、修改代码和调用工具，效率很高，也很危险。模型生成一条命令时，可能并不知道它会删除文件、上传密钥、修改系统配置或跑很久。系统级 Agent 的第一条原则应该是：模型只能申请执行，宿主决定是否允许。

命令白名单不是为了让工具变笨，而是把高风险动作挡在边界外。允许cargo test、rg、ls这类只读或低风险命令，限制rm -rf、网络上传、系统权限修改和不可控脚本。初学者写 Agent 时尤其要克制，别把本机交给一个会猜命令的模型。

二、执行链路：解析、审查、确认、记录

flowchart TD A[模型提出命令] --> B[命令解析] B --> C[白名单匹配] C --> D{风险等级} D -->|低风险| E[执行] D -->|高风险| F[用户确认] E --> G[记录审计] F --> G

白名单应基于命令和参数一起判断。只允许git status不等于允许全部git命令；允许cargo test不等于允许执行任意cargo run。很多危险都藏在参数里，例如输出重定向、管道、子 shell、通配符和路径逃逸。

更稳的做法是不用 shell 拼字符串，而是把命令拆成程序名和参数数组。这样可以减少注入风险，也更容易审查。模型生成自然语言或 JSON 请求，宿主解析后决定是否转换成真实进程。

三、规则示例：命令策略要可读

下面是一份简化的命令策略配置。真实项目还要处理路径、超时和环境变量。

commands: allow: - program: "cargo" args_prefix: ["test"] risk: "low" - program: "rg" args_prefix: [] risk: "low" - program: "git" args_prefix: ["status"] risk: "low" deny: - program: "rm" - program: "curl" - program: "chmod"

策略要默认拒绝。没有匹配到允许规则的命令，一律需要人工确认或直接拒绝。这样新风险不会自动进入执行范围。白名单可以随着使用场景逐步扩展，不要一开始就放开所有命令。

路径也要限制。Agent 如果被允许读写工作区，就不应该访问家目录、SSH 密钥、系统配置和浏览器数据。可以把所有文件操作限制在 workspace root 下，并拒绝..路径逃逸。路径校验最好使用规范化后的绝对路径。

四、执行细节：超时、输出和审计不能少

每个命令都要设置超时。模型可能请求运行长时间服务或卡住的测试，如果没有超时，Agent 就会挂住。输出也要限制大小，防止命令刷出大量日志把上下文撑爆。终端工具最怕无限输出。

审计记录应包含模型请求、最终命令、工作目录、开始时间、退出码、耗时和输出摘要。这样用户可以回看 Agent 做了什么。出现问题时，审计日志比“模型刚才好像运行了什么”可靠得多。

最后，高风险命令需要用户确认，而且确认页面要展示真实命令和影响范围。不要只写"是否继续执行操作"。用户需要知道将在哪个目录执行、会修改哪些文件、是否访问网络。确认要具体，才有意义。

有一次同事的 Agent 在 CI 里跑了整整 40 分钟的脚本循环，因为白名单只检查了命令名，没限制参数和子命令。后来加上参数白名单和超时上限，问题就没再出现。少一个限制，就可能多一个事故。

超时设置还要注意：同一命令在开发机和 CI 容器里的执行时间可能差 10 倍。建议超时值做成环境变量，方便不同环境调参。

五、总结

系统级 Agent 执行命令时，模型应该先申请，宿主再审查。白名单、参数解析、路径限制、超时、输出限制和审计日志，是最小安全边界。让 Agent 能做事之前，先让它不能乱做事。

查看全文

http://www.jsqmd.com/news/1113971/

ESP32-S2-MINI-2-N4R2：这颗带2MB PSRAM的WiFi模组，正在成为智能产品的“标配”

2026苹果手机去水印App推荐，iPhone免费无广告视频图片去水印工具

为什么你的Markdown在React中渲染失败？ChatGPT输出格式的3层校验链：schema→sanitizer→AST验证

Model-Centric Pipeline（MCP）：AI工程师的模型交付实战范式

30分钟破译基因组三维密码：Juicebox让Hi-C数据可视化如此简单

【GPTs零基础速成指南】：20年AI工程师亲授，7步打造专属智能体，错过再等半年！

智能项目管理：AI 不是项目经理，最多是风险雷达

【C++ AI 大模型接入 SDK】— 日志模块

LangChain Agent开发实战：日志与路径工具设计

像做信息检索一样做行测言语：核心技巧 + 避坑指南，正确率稳上 80%

如何永久保存微信聊天记录？WeChatMsg开源备份工具终极指南

广告合规检测工具开发指南：从词库构建到智能算法

Web安全实战：大规模分配漏洞原理、利用与防御

AI落地每日行动清单：技术领导者的四个校准锚点

临时处理PDF不用再找网站：搭建一个随身可用的私人PDF工具箱

Windows 11系统优化终极指南：如何用Win11Debloat一键提升性能51%

Asm Dd 10M导致System文件部分坏块修复---惜分飞

Obsidian 多端同步怎么选？从设备组合、笔记规模和移动端需求判断

ChatGPT调试不靠猜：用AST解析+执行轨迹回溯+LLM日志增强，构建可验证的AI-Code Debug Pipeline

AI学生高效学习法：用豆包实现概念具象化与任务链执行

爬虫逆向实战：3DES加密原理与Python模拟实现详解

机器学习工程师的统计可靠性实战指南

Node.js+Express构建高效后端API全攻略

Devin Review智能体架构解析：从代码审查到自主提交的自动化实践

计算机毕业设计之健康管理系统的设计与实现

ML生产化实战：四层防御架构实现模型稳态部署

仓储厂房提升门选型：密封性与耐用性双指标对比方案

如何让ChatGPT聊天机器人真正“听懂”业务？基于RAG+领域微调的5层语义理解架构（附医疗/电商/客服真实案例）

中小企业财务软件选型与用友实战应用指南

对比三种流行后端技术栈：Go、Java、Node.js