当前位置：首页 > news >正文

【Agent Harness】我给 AI 装上了“触觉神经”，它终于知道环境变了

news 2026/6/17 7:30:57

我给 AI 装上了“触觉神经”，它终于知道环境变了

摘要：本文深入解析 AI Agent 工作区文件监控系统的设计与实现。针对 Agent 对文件变化感知盲区的痛点，提出基于 notify 库的实时文件监控、L2 图数据库文件状态索引、LRU 缓存与差分读取、ToolGuard 硬约束拦截四层架构。通过流马（Gliding Horse）开源项目的实战案例，展示如何让 Agent 从“盲人摸象”到“睁眼看世界”，实现毫秒级文件感知、Token 节省 60%+、写入安全硬阻断等效果。适合 AI Agent 开发者、Rust 后端工程师、LLM 应用架构师阅读。

关键词：AI Agent 文件监控, 工作区感知系统, Agent 上下文管理, 实时文件变更检测, ToolGuard 硬约束, 文件状态索引, LRU 缓存差分读取, 流马 Gliding Horse, Rust notify 库, Agent 触觉神经

之前我在文章里说过，现在的 AI Agent 像个“盲人按摩师”——手艺不错，但每按一次都得问“是这儿吗？”。你不知道穴位在哪，它不知道文件变了没，你让它改代码，它可能拿三天前的版本开始改。

这个问题，本质上是 Agent 没有“触觉”。它对工作区的感知全靠主动去摸（file_list、file_read），摸到啥是啥，摸不到的就不存在。文件被外部修改了？不知道。上次读过但已经过期了？不知道。整个目录里还有哪些文件没读过？还是不知道。

于是 Agent 反复 ls、反复 cat，就像一个刚睡醒的人到处摸眼镜。Token 浪费在重复探索上，上下文被过时信息污染，决策建立在旧数据上。

所以我在流马（Gliding Horse）里加了一个新模块——工作区文件监控系统。说白了，就是给 Agent 装上“触觉神经”。

一、从“盲人摸象”到“睁眼看世界”

下面这张流程图直观展示了四层架构的整体设计，以及数据在各层之间的流动路径：

flowchart LRsubgraph A["① 实时监控层"]A1["notify 库<br/>(inotify/FSEvents)"]endsubgraph B["② 状态索引层"]B1["L2 图数据库<br/>文件状态追踪"]endsubgraph C["③ 缓存与差分层"]C1["LRU 缓存<br/>+ 差分读取"]endsubgraph D["④ 硬约束拦截层"]D1["ToolGuard<br/>过期写入阻断"]endA1 -- "文件变更事件" --> B1B1 -- "状态查询/更新" --> C1C1 -- "过期文件读取请求" --> D1D1 -- "Abort / 强制重读" --> C1C1 -- "返回最新内容" --> Agent["AI Agent"]B1 -- "过期状态通知" --> D1

数据流动说明：文件系统发生变更时，①实时监控层通过操作系统原生机制（inotify/FSEvents）毫秒级捕获事件，将变更通知推送给②状态索引层更新文件状态（read_fresh/read_stale 等）。当 Agent 发起文件读取请求时，③缓存与差分层先检查 LRU 缓存命中情况，若文件已过期则重新读盘并计算差分。在写入操作前，④硬约束拦截层会校验文件状态——若为 read_stale，ToolGuard 直接阻断写入，强制 Agent 先重读最新内容。四层协作，让 Agent 从被动轮询变为主动感知。

这玩意儿怎么工作的？分四层：

第一层：眼睛——实时文件监控。 用 notify 库（Linux 用 inotify，macOS 用 FSEvents，Windows 用 ReadDirectoryChangesW）盯着工作区。文件增删改，毫秒级感知。不是 Agent 去问“文件变了吗”，而是系统主动告诉它“变了”。

下面是用 Rust notify 库实现文件监控的简化代码片段：

use notify::{Config, Event, EventKind, RecommendedWatcher, RecursiveMode, Watcher};
use std::collections::HashMap;
use std::path::PathBuf;
use std::sync::mpsc;
use std::time::{Duration, Instant};
use std::thread;/// 文件监控器：监听工作区文件变更，带去抖和状态更新
struct FileWatcher {watcher: RecommendedWatcher,debounce_map: HashMap<PathBuf, Instant>,  // 文件路径 → 上次事件时间debounce_ms: u64,                         // 去抖窗口（毫秒）
}impl FileWatcher {/// 初始化文件监控器，返回事件接收通道fn new(watch_path: &str, debounce_ms: u64) -> (Self, mpsc::Receiver<Event>) {let (tx, rx) = mpsc::channel();// 创建 watcher，事件通过 tx 发送let watcher = RecommendedWatcher::new(move |res: Result<Event, notify::Error>| {if let Ok(event) = res {let _ = tx.send(event);}},Config::default(),).expect("无法创建文件监控器");let mut fw = FileWatcher {watcher,debounce_map: HashMap::new(),debounce_ms,};// 开始递归监控指定目录fw.watcher.watch(std::path::Path::new(watch_path), RecursiveMode::Recursive).expect("无法监控指定路径");(fw, rx)}/// 处理事件循环：去抖后更新文件状态fn process_events(&mut self, rx: &mpsc::Receiver<Event>) {loop {match rx.recv() {Ok(event) => {// 只处理文件内容变更事件（忽略权限/元数据变化）let relevant = matches!(event.kind,EventKind::Create(_) | EventKind::Modify(_) | EventKind::Remove(_));if !relevant {continue;}// 提取受影响的文件路径let paths: Vec<PathBuf> = event.paths;for path in paths {let now = Instant::now();// 去抖：如果该文件在 debounce_ms 内已有事件，跳过if let Some(last_time) = self.debounce_map.get(&path) {if now.duration_since(*last_time) < Duration::from_millis(self.debounce_ms) {continue; // 500ms 窗口内重复事件，忽略}}// 更新该文件的上次事件时间self.debounce_map.insert(path.clone(), now);// 更新文件状态（此处调用外部状态索引层）// 例如：mark_file_stale(&path);println!("[文件变更] {:?} | 事件: {:?} | 已去抖 {}ms",path,event.kind,self.debounce_ms);}}Err(mpsc::RecvError) => {eprintln!("事件通道已关闭，退出监控循环");break;}}}}
}// 使用示例
fn main() {let watch_dir = "./workspace";let debounce_ms = 500;let (mut watcher, rx) = FileWatcher::new(watch_dir, debounce_ms);println!("开始监控目录: {}（去抖窗口: {}ms）", watch_dir, debounce_ms);// 启动事件处理（实际项目中应放在独立线程或异步任务中）watcher.process_events(&rx);
}

代码说明：

RecommendedWatcher：自动选择当前平台最优实现（Linux inotify / macOS FSEvents / Windows ReadDirectoryChangesW）。
去抖机制：debounce_map 记录每个文件上次事件时间，500ms 内重复事件直接跳过，避免 IDE 连续保存触发多次通知。
事件过滤：只处理 Create / Modify / Remove，忽略权限和元数据变更。
状态更新：去抖通过后，调用外部状态索引层（如 L2 图数据库）将文件标记为 read_stale，供后续 ToolGuard 拦截使用。
而且做了 500ms 去抖——你保存文件时 IDE 可能 50ms 内写三次，系统只通知一次。

第二层：大脑——文件状态索引。 每个文件都有状态：read_fresh（已读且是最新）、read_stale（已读但已过期）、discovered_unread（发现但没读过）、written_unread（Agent 自己写的还没读）。这些状态存在 L2 图数据库里，Agent 随时能查“我有多少文件过期了”、“这个目录下有哪些文件我还没读过”。

第三层：记忆——内容缓存与差分。 读过的文件内容存进 LRU 缓存。下次再读，先检查文件 mtime：没变？直接拿缓存，零磁盘 IO。变了？重新读盘，算个 hash，和旧版本比对。如果 Agent 要的是“差分模式”，只返回改动的那些行（unified diff），不用全量重读。

第四层：神经反射——硬约束拦截。 如果 Agent 试图 file_edit 一个 read_stale 的文件，ToolGuard 直接 Abort：“这文件在外部被改了，你先 file_read 获取最新内容再改。”不是劝，是拦。这是硬约束，Agent 绕不过去。

二、几个让人舒服的场景

场景一：Agent 不用反复 ls 了

以前 Agent 每次做任务都要先 file_list 看目录结构，再 file_read 几个文件。现在系统启动时做一次全量扫描，建立完整的文件清单。之后文件变化由监控自动更新。Agent 直接问“有哪些未读文件”、“src/ 目录下状态分布”，系统秒回。Token 省了一大截。

场景二：文件被外部改了，Agent 自己知道

你手动改了个配置文件，Agent 之前读过这个文件（状态是 read_fresh）。文件监控捕捉到 Modify 事件，自动把状态改成 read_stale。下一轮 Agent 要用这个文件时，上下文里自动提示：“⚠️ 文件 config.yaml 已被外部修改，上次读取版本已过期。”Agent 就知道要先重读。

场景三：只读改动，不读全量

Agent 之前读过一个 500 行的文件，存了缓存。你改了 3 行。Agent 用 ReadMode::Diff 再读这个文件时，系统只返回：

--- a/src/auth.rs (version 3)
+++ b/src/auth.rs (version 4)
@@ -42,7 +42,7 @@
-    let token_expiry = Duration::hours(24);
+    let token_expiry = Duration::hours(48);

三行 diff，不是 500 行全量。Token 省了，注意力集中了。

场景四：改了 A 文件，自动提示 B 文件受影响

Agent 改了 src/lib.rs，ImportScanner 自动重新扫描，发现 src/app.rs 和 src/main.rs 都 import 了它。系统自动在 L2 里更新依赖关系，下次 Agent 问“改 lib.rs 会影响哪些文件”，系统直接列出来。

三、为什么不用 Git 做快照？

你可能想：这功能用 Git （纯Rust实现 Gitx）不就行了？每次改完 commit 一下，版本历史不就有了？

考虑过，放弃了。Git 太重——编译时间多 60 秒，二进制大 2MB，而且 Agent 不需要分支、合并、标签、远程同步这些东西。它只需要“创建快照 → 必要时回滚”。用 sled + sha2 + similar 就够：sled 存版本索引，sha2 做内容寻址，similar 做文本差分。三样东西加起来不到 150 行核心代码，性能还更好。

四、和其他模块的联动

这套“触觉神经”不是孤立的，它和流马的其他系统深度绑定：

感知系统：文件大量被外部修改时，触发“工作区异常”告警。
后台整理 Agent：文件变更事件触发知识抽取和记忆压缩。
代码 AST 提取：文件变了，自动重新解析 AST，更新知识图谱里的代码实体。
事件总线：所有文件变更都以 WorkspaceFile* 事件广播，任何模块都能订阅。

五、效果总结

能力	之前	之后
文件感知	Agent 主动轮询，有盲区	notify 事件驱动，毫秒级被动感知
状态管理	Agent 自己记“读过什么”	L2 图数据库托管，read_fresh/read_stale 精确追踪
文件读取	每次全量读盘	LRU 缓存 + 差分模式，Token 节省 60%+
写入安全	靠 Prompt 约束	ToolGuard 硬阻断过期写入
依赖感知	Agent 手动分析	ImportScanner 自动更新依赖图
快照回滚	无	sled 版本索引 + SnapshotManager，单文件/全工作区回滚