当前位置: 首页 > news >正文

Agent 系列(19):Harness 完整体系——8 层防护框架全景

从五要素到八层框架

第 17 篇介绍了 Harness 的五个要素:动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架,能处理大多数场景。

但生产级 Agent 面对的威胁更复杂:

  • LLM 被提示注入操控,绕过工具白名单用合法工具实现非法意图
  • 多步推理耗尽 Token 预算,系统雪崩
  • 审计日志被事后篡改,合规失效
  • 模型报告"已执行",但实际状态已被回滚——谁的话算数?

完整的 8 层框架在五要素基础上增加了三层主动防御:

Layer 1 Minimal Footprint 最小权限:任务只暴露必要工具 Layer 2 Action Space Registry 动作注册表:PermissionLevel 枚举,每个动作有 budget_cost Layer 3 Permission Budget 权限预算:spend() / BudgetExhaustedError Layer 4 Execution Sandbox 执行沙箱:输入净化 + 子进程隔离 Layer 5 Human Checkpoint 人工检查点:LangGraph interrupt(第 17 篇详述) Layer 6 Immutable Audit Log 不可篡改审计日志:哈希链 JSONL + 完整性验证 Layer 7 Rollback Coordinator 回滚协调器:事务 context manager Layer 8 Threat Model 威胁模型:对抗场景测试

本文用实测数据覆盖全部 8 层,附三个反直觉结论。


Layer 1:最小权限——任务决定工具范围

核心思路:不同任务类型只暴露必要工具,LLM 连其他工具的存在都不知道。

TASK_TOOL_MAP:dict[str,list]={"read_only":[read_data],"reporting":[read_data,send_report],"data_entry":[read_data,write_data],"admin":[read_data,write_data,send_report,delete_record],}defget_tools_for_task(task_type:str)->list:returnTASK_TOOL_MAP.get(task_type,[read_data])

每种任务类型的工具子集:

Task type → Available tools read_only → ['read_data'] reporting → ['read_data', 'send_report'] data_entry → ['read_data', 'write_data'] admin → ['read_data', 'write_data', 'send_report', 'delete_record']

read_only任务下,模型完全不知道write_datadelete_record的存在——bind_tools()只传入该任务的工具子集。

实测read_onlyAgent 查询sales_q1,预算消耗 1(一次read_data),没有任何越权行为。


Layer 2 & 3:注册表 + 权限预算

注册表设计:每个动作声明权限等级和预算成本。

classPermissionLevel(Enum):READ=1WRITE=2ADMIN=3IRREVERSIBLE=4@dataclassclassRegisteredAction:name:strlevel:PermissionLevel budget_cost:intdescription:strhandler:Any ACTION_REGISTRY:dict[str,RegisteredAction]={"read_data":RegisteredAction("read_data",READ,1,"Read a record",read_data),"write_data":RegisteredAction("write_data",WRITE,3,"Write/update a record",write_data),"send_report":RegisteredAction("send_report",WRITE
http://www.jsqmd.com/news/1002621/

相关文章:

  • 西安陕西 央国企事业单位银行券商互联网企业招聘信息整合
  • MPC7457架构解析:超标量、AltiVec与嵌入式高性能计算
  • 为什么 RPC 要比 HTTP 更快?我:之前项目只用过 HTTP...
  • 别再死记硬背公式了!用Cadence DC仿真,手把手教你搞定180nm工艺下gm/Id的精确设计
  • 摆脱论文困扰!盘点2026年人气爆表的的降AI率平台
  • 从高铁选座到密码加密:用Python解决8个意想不到的生活小问题
  • 别再为小程序蓝牙连接掉头发了!保姆级避坑指南(附完整可运行代码)
  • 光猫改桥接后,一根网线搞定IPTV和上网的保姆级教程(附VLAN配置避坑点)
  • 2026年德力斯手套箱行业精选厂家分析:技术、服务与案例全景解读 - 优质品牌商家
  • 用三菱PLC GXWorks2的SFC功能,搞定玩具分拣产线编程(附完整程序下载)
  • Okbiye AI 写作:毕业论文一站式智能创作工具,抚平毕业生论文撰写全流程压力
  • 保姆级教程:用STM32CubeMX和HAL库驱动MPU6050,实现姿态解算(附DMP库移植避坑指南)
  • 用三菱GXWorks2的SFC功能,手把手教你做个玩具分拣产线模拟程序(附完整源码)
  • 航司采购需求解析LLM调优:基于2026年大模型后训练范式的深度实践
  • 【新手零配置运行】 OpenClaw,桌面智能助手搭建全过程(含安装包)
  • 2026年齿轮加工厂分布全解析:从华北到西南的产业格局与实力厂商对比 - 优质品牌商家
  • SSRL框架:让大模型学会‘翻自己的笔记’而非依赖外部搜索
  • 2026年|降AI率收藏!学长实测10款AI智能降重工具红黑榜:论文降AI避坑(含免费降低AI率办法)
  • 5分钟快速上手:Locale-Emulator终极指南,彻底解决日文游戏乱码问题
  • 2026年贵州光伏项目优选:为何旭柏光伏墩源头厂家成为水泥墩底座品牌标杆? - 品牌鉴赏官2026
  • 终极yuzu模拟器指南:3小时从零到精通,免费畅玩Switch游戏
  • 【鸿蒙原生应用开发实战】第二篇:首页开发——宠物卡片+快捷入口+动态信息流
  • 2026年6月德州企业车拖车服务贴心推荐指南:如何构建高效的车辆应急保障体系 - 品牌鉴赏官2026
  • 草本头疗到底怎么样?一人一方针对护理
  • 2026年中济南地区值得信赖的氨基磺酸实力生产供应商深度解析 - 品牌鉴赏官2026
  • 2026年6月施耐德电气实力厂家口碑推荐,工控产品/电气自动化/中低压电气/施耐德电气,施耐德电气供应商推荐 - 品牌推荐师
  • 2026年 锯条/碳钢锯条/合金锯条厂家推荐:南通高铁配件与纺织配件厂商实力口碑之选 - 品牌发掘
  • AI 辅助的 Flutter 动画曲线智能推荐:从用户感知到参数搜索的工程方案
  • 告别Windows思维:在EAIDK-610的Linux上用Vim和GDB调试你的第一个C++程序
  • 2026甄选:东莞市茂立洁科技有限公司——研磨盘领域的专业制造厂家 - 品牌发掘