当前位置: 首页 > news >正文

开源工具 AIDA:给 AI 辅助开发加一个数据采集层,让 AI 从错误中自动学习(Glama 3A 认证)

开源工具 AIDA:给 AI 辅助开发加一个数据采集层,让 AI 从错误中自动学习(Glama 3A 认证)

一、痛点:AI 写代码很快,但总在同一个地方犯错

现在用 AI 写代码已经很普遍了 —— Claude Code、Cursor、Copilot,效率确实高。但用过的人都知道一个问题:

AI 没有项目级记忆。你今天告诉它"我们项目的 Table 组件外面要包一层 min-height 容器",明天它又忘了。你纠正了三次 API 调用方式,第四次它还是用错。

根本原因是:每次对话都是独立的,AI 不知道上次在你的项目里犯了什么错。

AIDA就是为了解决这个问题而生的 —— 它在 AI 开发过程中自动采集结构化数据,把 AI 的偏差模式沉淀成项目规则,让 AI 越用越准。

项目已通过 Glama.ai 平台的安全、许可和质量三重 A 级认证,MIT 开源。

二、30 秒接入

在项目根目录的.mcp.json加一行:

{"mcpServers":{"aida":{"command":"npx","args":["-y","ai-dev-analytics","mcp"]}}}

支持 Claude Code、Cursor、VS Code Copilot、Windsurf。加完配置后不需要任何其他操作,你照常用 AI 写代码就行。

npm 下载慢可以先全局安装:npm install -g ai-dev-analytics,然后 command 改成"aida"

三、架构与原理

你的 AI 工具 (Claude Code / Cursor) ↓ MCP 协议 (stdio) AIDA MCP Server (10 个工具) ↓ 自动采集 .aidevos/run.json (结构化数据) ↓ 数据看板 (localhost:2375) 规则库 (.aidevos/rules/) ↓ AI 下次读取规则 → 输出质量提升

关键设计:

  1. MCP 协议通信:AIDA 不是让 AI 执行 shell 命令,而是通过 MCP(Model Context Protocol)提供原生工具,AI 直接函数调用,响应更快、更可靠
  2. 零运行时依赖:整个项目不依赖任何第三方包,纯 Node.js + TypeScript
  3. 100% 本地:所有数据存在项目目录的.aidevos/下,普通 JSON 文件,没有任何外部 HTTP 请求

10 个 MCP 工具

工具名功能触发时机
aida_task_start记录任务开始AI 开始编码时
aida_task_done记录任务完成AI 完成编码时
aida_log_bug记录 Bug发现缺陷时
aida_bug_fix记录 Bug 修复修复完成时
aida_log_review记录代码自检自检完成时
aida_log_deviation记录偏差AI 输出不符合预期时
aida_log_files记录文件变更自动扫描 git diff
aida_highlight记录亮点有值得记录的优化时
aida_status查看当前状态随时
aida_log_rule沉淀项目规则用户确认后

所有工具都是 AI 自动调用的,开发者不需要手动操作。

四、核心机制:偏差 → 规则 → 反哺

这是 AIDA 的核心价值,用一个真实项目的数据说明:

第 1 轮开发:47 个任务,产生 23 个偏差。

先看根因分布 —— AI 为什么出错?

是 AI 幻觉(使用了不存在的 API / 组件),还是规则缺失(项目有规范但 AI 不知道)。

再看类别分布 —— AI 在哪出错?

从中提取了 6 条项目规则,写入.aidevos/rules/

第 2 轮开发:同类偏差 →零复现。AI 读了规则,相同模式的错误被消除。

看偏差与规则趋势 —— 绿色线是规则数量,随着规则积累,偏差持续下降:

这就是数据驱动的复利效应。

规则沉淀流程

1. AI 编码 → 产出不符合预期 2. 记录偏差 → aida_log_deviation(自动分析根因) 3. 根因为 rule-missing → AI 建议沉淀规则 4. 开发者确认 → aida_log_rule 写入规则库 5. 规则库通过 fingerprint 自动去重 6. 下次 AI 读取规则 → 同类错误不再复现

沉淀的规则举例:

  • “el-dialog 内 Table 必须有 min-height 容器”
  • “API 请求必须走 src/api/ 统一封装层”
  • “日期组件必须传 format=‘YYYY-MM-DD’”

这些都是项目级技术规范,不涉及业务逻辑,适合沉淀为持久规则。

五、数据看板

npx ai-dev-analytics dashboard

打开http://localhost:2375,看到所有采集的数据:

在线 Demo(真实脱敏数据):https://lwtlong.github.io/ai-dev-analytics/

看板包含:

模块内容
偏差根因分布饼图:幻觉 / 规则缺失 / 上下文不足 / 理解偏差
偏差类别分布饼图:布局 / 组件 / API / 样式
偏差 & 规则趋势折线图:偏差和规则的变化趋势
Bug 严重度分布各等级 Bug 统计
自检通过率折线图:代码审查质量趋势
任务完成进度各阶段任务状态
文件修改热点哪些文件被反复修改
规则溯源表每条规则关联到产生它的偏差
完整时间线所有事件按时间排列

技术栈:React 19 + ECharts + Tailwind CSS 4,支持中英文切换,SSE 实时推送。

六、三种使用模式

AIDA 设计上是可以按需组合的,不是非得全套使用:

模式一:纯数据采集(最轻量)

只加 MCP 配置,正常 coding。AIDA 静默采集,想看数据时开看板。零学习成本,适合个人开发者先试试水。

模式二:数据采集 + 规则沉淀

在模式一基础上,当 AI 犯错时主动记录偏差,确认后沉淀规则。逐步建立项目专属的 AI 知识库。

模式三:完整 SOP 流程

aida init# 选择 Full workflowaida start# 创建开发运行

获得 14 个 AI Skills,编排为标准开发流程:

PRD 接入 → 需求分析 → 任务拆分 → 代码生成 → 自检审查 → Bug 修复 → 偏差记录 → 规则沉淀

适合团队标准化 AI 开发流程,每个环节有对应的 Skill 执行,中断后可从断点恢复。

七、绩效汇报:数据比感觉有说服力

所有数据都是结构化 JSON,可以直接拿来做汇报:

汇报场景AIDA 能提供的数据
H1/H2 绩效完成 XX 个任务、修复 XX 个 Bug、首次自检通过率 XX%、沉淀 XX 条规则、产出 XXXX 行代码
Sprint 回顾本轮偏差集中在哪个类别、新增了几条规则、质量指标变化
团队报告各开发者任务量/偏差率/规则贡献对比
项目交接完整开发历史 + 规则库,新人接手直接受益
aida report# 生成汇总数据

以前写绩效靠回忆,现在一条命令导出全部数据。

八、数据模型

.aidevos/ ├── runs/ │ └── {分支名}/ │ ├── requirement.json # 分支聚合统计 │ └── {开发者}/ │ └── run.json # 核心数据文件 ├── rules/ │ ├── rules.json # 规则注册表 (source of truth) │ ├── component.md # 按分类自动生成的视图 │ └── api.md ├── index.json # 项目级索引 └── aida-guide.md # AI 行为引导

run.json包含:tasks、bugs、deviations、reviews、files、timeline、rules、highlights、metrics、cost 等完整维度。

九、项目信息

  • GitHub:https://github.com/LWTlong/ai-dev-analytics
  • npm:https://www.npmjs.com/package/ai-dev-analytics
  • 在线 Demo:https://lwtlong.github.io/ai-dev-analytics/
  • Glama:https://glama.ai/mcp/servers/LWTlong/ai-dev-analytics
  • 认证:Glama.ai 安全 A / 许可 A / 质量 A
  • 协议:MIT
  • 技术栈:Node.js + TypeScript / React 19 + ECharts / MCP over stdio
  • 测试:82 个用例,29 个测试套件,全部通过
  • 依赖:零运行时依赖

总结

AIDA 解决的核心问题:AI 辅助开发缺乏可观测性。

你不知道 AI 在你的项目里表现怎么样、哪里容易出错、怎么才能让它变好。AIDA 把这些全量数据化:采集 → 可视化 → 沉淀规则 → 反哺 AI → 循环改进。

不是替代你的工作流,而是在你现有工作流上加一层数据采集。一行配置接入,想用多少用多少。

如果你也在用 AI 写代码,不妨试试。有问题欢迎交流。

没有数据的 Vibe Coding 只是在 Vibe。有了数据,你的 AI 每次运行都在进化。

如果觉得有用,欢迎 star 支持一下。有问题直接提 Issue,会认真回复。

http://www.jsqmd.com/news/538055/

相关文章:

  • AI赋能测试:让快马平台智能分析测试日志并生成修复建议
  • 高效管理MySQL历史数据:pt-archiver实战指南
  • 无锡高端腕表走时慢故障全解析:从百达翡丽到欧米茄,京沪深杭宁锡六地精准诊断与修复指南 - 时光修表匠
  • 从产品经理到AI产品经理:掌握未来,高薪转型指南!如何从传统产品经理转行成为顶尖的AI产品经理?
  • macOS Sequoia 15.7.5 (24G624) Boot ISO 原版可引导映像下载
  • 长期跳健身操,颈椎会过度屈伸损伤吗
  • 大气层自定义固件配置指南:从准备到进阶的完整实践
  • 第3章 基本语法-3.4 模块和包
  • 支付宝红包套装回收如何秒变收益,回收思路解析 - 京回收小程序
  • miniMachineBLE:基于ESP32的教育机器人BLE控制库
  • Qwen3.5-4B-Claude-Opus-GGUF开发者案例:SQL查询优化路径的分步推理生成
  • 【ACM出版,往届均已EI检索】第二届生物信息学与计算生物学国际学术会议(ISBCB 2026)
  • 团队低效困局何解?DooTask 直击真实协作痛点
  • 大润发购物卡高价回收技巧揭秘与实用指南 - 团团收购物卡回收
  • 思源宋体终极指南:免费商用字体如何让你的设计效率提升3倍?
  • 『NAS』在飞牛部署一个到期提醒工具-RenewHelper
  • 2026磁翻板液位计行业全景解析:实力厂家口碑测评与甄选攻略 - 品牌推荐大师
  • 5步搞定PDF文字提取:用免费开源工具解决文档数字化难题
  • 2串双节锂电池保护芯片PW7120:电子工程师的选型与应用宝典
  • win11安装python后,无法在命令行启动python
  • AI 开发实战:让 Bug 分诊从靠感觉变成有章法
  • 基于Python与Electron的抖音无水印视频下载器:技术架构与实现深度解析
  • 2026年口碑好的收购光缆源头厂家选择评测指南,市场收购光缆哪家好综合实力与口碑权威评选 - 品牌推荐师
  • 33种语言互译!HY-MT1.5-7B翻译大模型保姆级部署教程,零基础入门
  • synchronized 和 ReentrantLock 的区别是什么?
  • 【另行征集中、英文期刊】中国公路建设行业协会沉管隧道分会技术交流大会暨第九届交通运输与土木建筑国际学术交流大会 (ITT CHCA TEC ISTTCA 2026)
  • ArcGIS应用(二):高效提取遥感影像多波段值的进阶技巧
  • WPF Button控件实战:从基础属性到高级命令绑定全解析(附完整代码示例)
  • Godot学习05 - 播放动画
  • 零零碎碎