当前位置: 首页 > news >正文

【Agent Harness】AI连个前端Web页面都做不出来,凭什么让我信它能写后端?

AI连个前端Web页面都做不出来,凭什么让我信它能写后端?

AI连前端UI都做不精准——按钮颜色、圆角、间距反复出错,暴露了它缺乏精确映射与自主校验能力的本质。后端开发看似“还行”,实则错误更隐蔽、代价更大。本文从AI画不好UI这一现象切入,揭示AI能力的真实边界,并介绍如何通过工程化手段(系统校验、自动纠错、经验沉淀)弥补AI缺陷,让AI从“可用”走向“可靠”。

最近在群里看到一个吐槽,笑死我了:

“让AI照着设计稿写个页面,结果它给了一个蓝底黑字的按钮,圆角还是方的。我截图圈出来让它改,它说‘已修改’,然后给了一个红底白字的按钮。”

笑了之后,我突然意识到一个很严肃的问题:连UI这种“一眼就能看出对不对”的活都干不利索,我们凭什么相信AI能自主完成那些“看不见摸不着”的后端开发、数据库设计、系统架构?

一、前端UI是AI能力的“照妖镜”

前端开发有个特点:结果立等可见。你给AI一张设计稿,让它生成HTML/CSS,效果好不好,打开浏览器一眼就看出来了——按钮位置偏了5像素、颜色不对、字体错了,根本不用技术背景,是个人都能指出来。

但恰恰是这个“一眼能看出来”的活,目前的AI做得很差。

你让它照着Axure导出的HTML复刻一个页面,它能把布局搞乱、把间距吃掉、把颜色换成它觉得“更合理”的配色。你让它“改回去”,它要么改得更离谱,要么说“已修改”但其实什么都没动。

为什么?因为前端还原不是“生成代码”,而是“精确映射”。AI擅长生成“看起来像”的东西,但不擅长“一模一样”。它没有视觉校验能力,没有像素级的精确度,更不会主动对比自己的输出和原始设计稿之间的差异。

前端是AI能力的“照妖镜”,因为它把AI的缺陷暴露得明明白白:幻觉、自以为是、缺乏精确校验、无法自主纠错。

二、后端开发其实更惨,只是你看不见

很多人觉得:“前端做不好没关系,后端逻辑AI写得还行。”

行个鬼。

前端你还能一眼看出问题,后端的问题是你根本看不见。AI帮你设计了一个数据库Schema,少了一个关键索引,等上线后QPS上来了才发现查询要5秒——这时候你已经加班一个月了。AI帮你写了个认证逻辑,token有效期写死24小时,结果有个业务需要7天,上线后用户疯狂掉线——你又得连夜修。

后端开发不是比前端更简单,而是后端的错误更隐蔽、代价更大、发现更晚。

AI在这里的毛病和前端一模一样:它不会主动校验自己的输出是否符合需求文档,不会检查是否有遗漏的边界条件,更不会预测这个设计在未来业务扩展时会不会崩盘。它只是“生成了一段看起来合理的代码”,然后等着你发现漏洞。

前端画不好UI,是AI能力不够的直接证据。你之所以觉得AI写后端“还行”,只是因为后端的错误没那么容易被肉眼发现而已。

三、从“完全信任AI”到“工程化弥补AI缺陷”

所以结论很明确:单凭AI自己的能力,离“完全信任地自主完成任务”还差得远。不管是前端还是后端,不管是UI还是数据库,AI都需要一个“监工”——一个能帮它校验、纠错、回溯、沉淀经验的系统。

这就是我为什么要做流马(Gliding Horse)——一个Agent Harness,一个AI Agent的操作系统。

流马不是让AI更聪明,而是让AI更可靠。它是这么干的:

1. 系统调用门:AI输出必须过“安检”

每次AI要调用工具或写入数据,流马会先做两层校验:JSON Schema校验(参数格式对不对)+ 数字签名验证(这个Skill是不是被篡改过)。AI想瞎写?门都进不来。

2. CA检查Agent:专门给AI挑刺

流马有一个专门的CA(Check Agent),不干别的,就负责检查DA(执行Agent)的输出。前端代码写好了?CA先对比设计稿和实际渲染截图,发现颜色不对、间距偏差,直接打回,触发重新生成。后端Schema设计了?CA自动跑一遍查询性能测试,发现缺索引,立刻标记。

3. 知识图谱记忆:犯过的错不再犯

每次AI犯错,CA的检查结果会被写入知识图谱。下次有类似任务,SA(Supervisor Agent)会提前注入历史经验:“上次类似的设计稿,AI把圆角写成了直角,这次重点关注按钮样式。”这就是L0长期记忆的真正价值——不是存聊天记录,而是存“教训”。

4. 动态PDCA:死循环改到合格为止

DA生成代码 → CA检查 → 不合格 → 打回DA重做 → CA再查。这个循环可以自动跑好几次,直到CA说“过了”为止。人不用盯着,流马自己就能把AI的输出打磨到可用状态。

四、所以,AI到底什么时候能自己画UI?

我也不知道。但我确定的是:与其等模型厂商把AI训练到“一遍过”,不如现在就用工程手段把AI的输出质量管起来。

流马的思路不是“相信AI”,而是“不信任AI,所以给它套了个完整的质量管控体系”。这套体系里,AI只是干活的,校验、回溯、纠错、经验沉淀,全是系统在兜底。

这就是Agent Harness的价值:不是让马跑得更快,而是给马套上缰绳、配上骑手、装好导航。

AI连UI都画不好的今天,谈“自主完成任务”还为时过早。但如果你给AI配上一个可靠的运行环境——能校验它、纠正它、从它的错误中学习——那它离“可用”就近了一大步。

五、流马开源,欢迎来玩

流马(Gliding Horse)的所有核心代码都在GitHub上开源,用Rust写成,图数据库用Oxigraph,记忆系统借鉴了CPU缓存架构。文档还在补,但架构和理念已经能打。

如果你也对“给AI套缰绳”这件事感兴趣,或者觉得动态PDCA、知识图谱校验、系统调用门这些概念有点意思,欢迎来star、提issue、一起搞。

最后说句心里话:别被“AI将取代程序员”这种话忽悠了。AI现在还处于“连个按钮都画不准”的阶段。真正能让AI可靠落地的,不是更强的模型,而是更强的工程。流马想做后者。

GitHub地址:https://github.com/doiito/gliding_horse

http://www.jsqmd.com/news/1022556/

相关文章:

  • 深入解析防爆认证ex ia Ⅱc T3:原理、设计与工程实践
  • 2026甘肃贵金属旧料回收优质实体店精选 5 家 黄金回收铂金白银回收真实探店测评清单 - 中业金奢再生回收中心
  • XPath自愈技术:基于概率排序的鲁棒元素定位方案
  • 2026陕西当地贵金属回收权威名录 TOP5 黄金金条铂金白银回收线下门店信息汇总 - 信誉隆金银铂奢回收
  • 2026年淮南市初三没考上高中怎么办?这所淮南本地公办学校值得关注 - 我叫小周
  • 如何5分钟掌握网易游戏NPK文件解压:从入门到精通完整指南
  • 2026年想换B2B系统,从“易用性+性价比”角度,求推荐
  • 从监管数据看:重庆黄金回收合规门店怎么分辨 - 讯息早知道
  • 2026苹果手机照片去除背景保姆级教程,iPhone相册一键抠图保存透明背景全步骤 - AI测评专家
  • 2026深圳闲置黄金盘活指南|本地高性价比服务机构盘点 - 奢侈品回收测评
  • Mythos模型:可规模化漏洞挖掘的AI安全新范式
  • 物联网技术在源网荷储系统中的创新应用
  • 2026龙岩商户高频选择的 5 家公共卫生第三方检测机构实地测评整理 公共场所 + 水质卫生检测 附电话地址 - 鉴安检测
  • AI工作流实现Excel自动化+SQL,零 VBA ,零公式,电商订单分析案例 | DTBot
  • 从Laggle到Kaggle:数据科学竞赛平台访问与实战指南
  • 2026中卫旧金铂金白银回收高信赖门店 TOP 线下实体商家电话与门店地址一览 - 诚金汇钻回收公司
  • 安阳高口碑黄金铂金回收白银回收实体老店排行 5 家靠谱门店电话地址全收录
  • 宁夏全城贵金属回收优选门店 TOP5 黄金回收铂金回收白银回收正规商家地址汇总 - 中安检金银铂钻回收
  • 2026宁波商户高频选择的 5 家公共卫生第三方检测机构实地测评整理 公共场所 + 水质卫生检测 附电话地址 - 鉴安检测
  • Data Fabric 如何在不搬运数据的情况下统一访问数据
  • 南昌全城贵金属回收优选门店 TOP5 黄金回收铂金回收白银回收正规商家地址汇总 - 中安检金银铂钻回收
  • 终极指南:快速掌握ImageGlass免费图像浏览器,轻松管理90+图片格式
  • Bioconductor:面向生物组学的R语言计算显微镜
  • 兰州西固区黄金回收避坑指南与6大正规机构对比 - 专业黄金回收
  • 告别AI编程工具404困境:从API依赖到稳定本地化部署全解析
  • 武汉三新高级技工学校—官方推荐省级重点中职 - 善良的阿良
  • 锦州考 CPPM 多久能拿证? - 中供国培
  • 如何永久保存微信聊天记录:打造个人专属的数据记忆库
  • 泸州全城贵金属回收优选门店 TOP5 黄金回收铂金回收白银回收正规商家地址汇总 - 中安检金银铂钻回收
  • 【ACM出版 | 贵州大学主办,南昌师范学院数学与信息科学学院、遵义师范学院协办 | EI , Scopus,谷歌学术检索】第六届互联网技术与教育信息化国际学术会议(ITEI 2026)