当前位置: 首页 > news >正文

给老系统装一层 “能办事的 AI”:企业 Agent 卡住的最后一步,SkillsUI 想补上

让我们从一个所有做企业 Agent 的人都遇到过的具体场景说起。

某券商风控员要给客户开通融资融券账户,传统流程是这样的:登录 OA 提风控审批 → 跳到 CRM 拉客户资料 → 跳到风控系统填评估表 → 跳到电子签平台发签约链接 → 回 OA 关单。十几个字段反复填,跨四个系统切换,单子办下来 30 分钟。

如果你试过把这个流程交给一个 GPT-4 + function calling 的 Agent 来跑,结果大概率是这样:模型能聊得很顺,但真到调用环节就开始扑街——参数对不上、字段命名乱、调用失败没有兜底、人在哪个节点该介入说不清、跨系统的状态不知道往哪存。

这不是模型能力的问题。是模型能力和企业系统现实之间,存在一段没人写过的工程层。

这段工程层是兔展智能 SkillsUI想填的坑。

SkillsUI 当前已开放免费模拟体验,注册还送积分:https://skillsui.rabbitpre.com.cn/?c=csdn

下面我们试着把它的设计取舍说清楚——尤其是给同样在做企业 Agent、被这些问题反复磨过的工程师看。

问题的本质:function calling 和 MCP 解决不了的那段路

过去两年,企业 AI 工程化的工具链已经卷出了几层:

  • 底层:function calling(OpenAI、Anthropic)、MCP(Model Context Protocol,Anthropic 推出的工具协议);

  • 编排层:LangChain / LangGraph、AutoGen、CrewAI、OpenAI Assistants API;

  • 应用层:各家自研的 Agent 平台、Copilot 类产品。

但真到企业内部落地,开发者会遇到几个共同的问题:

问题 1:企业 API 是给人写的,不是给 AI 写的。
参数命名混乱,文档残缺,字段含义靠口口相传。直接喂给 LLM 做 function calling,调用成功率经常不到 50%。

问题 2:复杂业务流程里,“”必须被留下来。
金额确认、合同签字、对外发送指令——这些节点不能让 Agent 自己拍板。但社区里大部分 Agent 框架对“人在环”(Human-in-the-Loop)的处理都很潦草,要么是 input() 阻塞,要么是把整个流程序列化暂停,工程上不优雅。

问题 3:纯文本对话承载不了企业级交互。
让员工在聊天框里“敲十行字描述一个表单字段”,体验比直接打开旧系统还差。但社区里大部分 Agent 框架的输出形态还是文本流。

问题 4:跨端续办的状态一致性没人管。
手机上发起、PC 上接续、大屏上确认——这是企业一线作业的常态,但 session 状态怎么序列化、上下文怎么续传、节点状态怎么同步,社区里几乎没有标准答案。

SkillsUI 的设计逻辑,就是把这四个问题逐个工程化解决。

三层架构:Agent 调度 / Skill 工作流 / AIUI 卡片

SkillsUI 把企业 Agent 拆成了三层,每一层职责单一、互相解耦:

下面分别讲每一层的工程取舍。

2.1 Agent 调度层:把 Planning 和 Skill 编排彻底分开

很多 Agent 框架的常见反模式是——把任务规划、参数解析、API 调用、错误处理全都塞进 Agent 的 prompt 里,靠 ReAct 循环硬扛。这种做法在 demo 里看着很聪明,到生产环境立刻被否掉:

  • 一旦业务规则变了,要回去改 prompt;

  • 错误处理逻辑分散在 LLM 的"思考"里,不可控;

  • 复杂流程的步数一多,token 成本和延迟都失控;

  • 没有稳定的 schema,幻觉问题很难收敛。

SkillsUI 的做法是把 Agent 调度层的职责严格收窄——它只做三件事

(1)意图识别:把用户的自然语言映射到一个或多个 Skill;

(2)任务规划:决定 Skill 的执行顺序,处理依赖关系;

(3)多轮 slot filling:缺参数主动问询,不盲目猜测。

具体的业务规则、异常处理、人机协同节点——全部下沉到 Skill 层内部。Agent 调度层不感知 Skill 的实现细节,只感知它的输入输出 schema。

这个分层和 LangGraph 的“显式状态机 + 节点化”思路同向,但 SkillsUI 把“状态机的节点定义”做成了一个有完整工程规范的 Skill 资产,而不是写死在代码里的 graph。

2.2 Skill 层:原子能力的“可执行规范”

这是 SkillsUI 最值得讲的一层,也是和 MCP、LangChain Tools 拉开差距的地方。

社区主流的工具调用,本质上就是一个 JSON Schema + 一个执行函数。但企业级业务里,一个“能让 Agent 真正办事”的能力单元,至少要包含五样东西:

  • 输入参数规范

  • 业务规则

  • 多系统调度链路

  • 异常处理

  • 人机协同节点

为什么要这么“重”?

因为企业级 Agent 的可靠性,不是靠 LLM 的“思考”挣来的,是靠把不确定性收敛在 Skill 内部挣来的。

LLM 只负责选用哪个 Skill 和填什么参数,剩下的全部由 Skill 自己保证。

这套 Skill 抽象和 MCP 的关系是:MCP 解决的是“模型怎么连工具”,Skill 解决的是“工具长什么样才适合 AI 调用”。

Skill 可以无缝以 MCP 协议对外暴露,但它本身的设计规范比 MCP 更丰富。

2.3 AIUI 层:把“输出形态”从文本流升级到可交互卡片

这层是 SkillsUI 在产品形态上最有辨识度的判断——企业级 AI 入口不该是聊天框。

办企业级业务,员工要做的动作是:填表、对比、确认、签字、上传附件。这些动作在文字对话里都很别扭。SkillsUI 把交互单元拆成了一组卡片:

  • 输入采集卡:替代纯文本提问,让用户在卡片上选参数、填字段、上传文件;

  • 进度卡:跨系统调用过程中的实时阶段提示(流式 + step 级别);

  • 结果回显卡:把业务数据以表格、指标、决策矩阵的形式可视化呈现;

  • 关键节点确认卡:金额、合同、签字等节点的“一键确认”。

这个判断和 Anthropic Artifacts、ChatGPT Canvas 同向——AI 的输出形态正在从“一段文本”进化为“一个可交互工作单元”。SkillsUI 把它推得更远,直接定义为企业入口的标准形态。

▲卡片化办事前后对比

工程上更值得讲的是跨端续办

一张卡片在手机上发起、PC上接续、大屏上确认,要解决三个问题:

(1)Session 状态序列化:业务上下文 + 当前节点 + 已填字段,必须能跨端恢复;

(2)节点幂等性:同一个节点被两端同时操作时,必须有版本号 / 乐观锁防止脏写;

(3)实时同步:用 WebSocket / SSE 推送状态变更,避免一端操作后另一端看到旧状态。

这些是任何做过分布式协作系统的人都熟悉的工程问题,但放到 Agent 的 session 上下文里,社区里现在还没有成熟方案。

接入工程:从存量 API 到可调度 Skill

技术人员最关心的工程问题之一:那这套东西怎么接到我已有的几百个 API 上?

SkillsUI 给出了两条路径:

路径一:基于 OpenAPI/Swagger 的半自动化生成

如果你的系统有规范的接口文档,工具会做这几件事:

(1)解析 OpenAPI 文档,提取接口语义、入参出参、错误码;

(2)用 LLM 做语义增强——把 flag1: int 这种字段名翻译成“是否需要风控审批”这种 AI 可读的描述;

(3)生成 Skill 骨架,自带基础的参数校验、重试、错误处理;

(4)在可视化面板上人工微调——补充业务规则、定义 HITL 节点、配置异常分支。

这一步不是 5 分钟。真实工程里,一个中等复杂度的业务 Skill,从 API 文档到生产可用,通常需要 0.5–2 个工作日。但相比从零写一套 LangChain Tool + 编排逻辑,已经是数量级的提速。

路径二:业务嗅探(针对没有标准接口的老旧系统)

很多政务、金融、医疗的老系统没有 OpenAPI 文档,甚至接口本身就是非标 SOAP 或自定义协议。SkillsUI 的做法是:

(1)在企业授权下,挂在系统的网关层做流量观测;

(2)用模型反推接口语义和数据结构;

(3)半自动生成 Skill,工程师再做一次复核。

这套思路接近“AI 时代的 API 文档逆向工程”,对老旧系统的 AI 化是一个相对务实的入口。

几个工程层面的关键设计决策

讲到这里,有几个 SkillsUI 在设计上的关键决策值得拉出来说说。它们不是产品功能,是真正的工程取舍。

决策 1:80/20 原则——AI 不替人做关键决策

所有涉及金额、合同、对外发送、设备指令的节点,AI 只完成“准备工作”,最终一键由人确认。这件事在 Skill schema 里是一等公民,不是后加的功能。

这是企业级 Agent 能跑生产的最低门槛。

决策 2:复用原系统的权限边界,不另建一套

SkillsUI 调用任何系统时,使用的是当前用户在原系统里的权限——不会越权、不会绕过审批。

这避免了一个非常危险的反模式:Agent 拿一个超级账号去办所有人的事。

决策 3:全链路 tracing 和审计日志

每一次 Skill 调用——谁、什么时候、调用了什么、传了什么参数、收到什么结果——全部进审计日志。这一条不只是合规要求,对工程团队而言是 debug 一个出错 Agent 的唯一抓手。

设计上和 Langfuse、LangSmith 这类 LLM 可观测平台类似,但更下沉到了业务节点。

决策 4:Skill 的版本控制和灰度发布

业务系统会变,Skill 也得变。SkillsUI 把 Skill 当作有版本的 artifact 管理——支持灰度发布、回滚、多版本并存。这件事在大部分 Agent 框架里现在还是缺失的。

在行业生态里的位置

一句话讲清楚 SkillsUI 在生态里的位置:

SkillsUI 不和模型层、协议层、编排层竞争——相反,它依赖这些底层的能力。

它要解决的是上层的应用 / 中间层问题:把企业的存量系统能力,重新组织成 AI 可以稳定调用、用户可以一句话办成的 Skill 资产。

这一层目前在中国市场还很空。SkillsUI 的核心赌注是——这一层会变成下一阶段企业 AI 落地的标准形态。

留给同行的一个问题

最后,留给所有正在做企业 Agent 的工程师一个问题:

你公司未来三年的 IT 入口长什么样?

如果答案还是“打开 ERP、找菜单、点按钮”,那你团队接下来三年的工作大概率会越来越没人愿意用。

如果答案是“说一句话,事情就办了”,那从今天开始你需要回答几个工程问题:你的 API 是不是 AI 可读的?你的业务流程有没有显式的 HITL 节点?你的 session 状态能不能跨端续办?你的 Agent 调用有没有完整 tracing?

这一层早晚要有人做。不一定是 SkillsUI,但一定是一层中间层。

欢迎点击【阅读原文】,跳转至 SkillsUI 官网链接!SkillsUI 当前已开放免费模拟体验,注册还送积分:https://skillsui.rabbitpre.com.cn/?c=csdn

http://www.jsqmd.com/news/867585/

相关文章:

  • 2026年5月,四川空调清洗如何选?深度剖析宜宾兰嫂家政服务有限公司 - 2026年企业推荐榜
  • 【NotebookLM可信度红蓝对抗报告】:我们用17类对抗性提示攻击了12个主流配置,结果令人震惊…
  • 2026 谷歌 GEO 已成流量主战场,不懂 AI 搜索直接掉队
  • 2026定制PLC控制柜技术选型指南:食药设备电气成套控制柜/PLC变频控制柜/低压弱电集成柜/低压集成配电柜/选择指南 - 优质品牌商家
  • 利津县黄金回收白银回收铂金回收店铺哪家好 靠谱门店推荐 - 莘州文化
  • NotebookLM移动端体验全拆解(iOS/Android双端对比报告·仅限内测用户知晓的性能阈值)
  • 2026论文降AI率必备清单:AI率92%暴降至5%!实测10款降AI率工具!薅羊毛技巧!
  • 2026现阶段混凝土搅拌站厂商选型指南:郑州市建新机械制造有限公司的综合实力解析 - 2026年企业推荐榜
  • 2026年国内不锈钢水箱厂家TOP5实力排行:成都实验室污水处理设备厂家、成都常温除氧器厂家、成都废水处理设备厂家选择指南 - 优质品牌商家
  • 高通量细胞因子/生物因子检测技术介绍
  • 【2026 Q1实测数据】ChatGPT新增“因果推理引擎”准确率提升至89.7%,但83%用户因忽略这4个参数设置导致失效
  • 2025-2026年欧易生物电话查询:使用多组学科研服务前需核实资质 - 品牌推荐
  • 宁津县黄金回收店铺哪家好 靠谱门店推荐及联系方式 - 莘州文化
  • 有哪些真正好用的降AI率工具?能同时不降文笔还能清零AI疑似率的那种
  • 2026年4月端子箱接线盒技术性能实测排行解析:电缆接线盒/设备接线盒/PLC控制箱接线盒/TIBOX天齐电气接线盒/选择指南 - 优质品牌商家
  • 2025-2026年全球蛋白组学服务公司推荐:五大口碑产品评测多组学整合降本增效市场份额价格 - 品牌推荐
  • Python(循环中断)
  • 别再用curl硬刚了!3种主流语言(Python/Node.js/Java)调用ChatGPT API的工业级封装方案
  • 2025-2026年北京老房翻新装修公司推荐:TOP5排名专业评测性价比高价格选择指南 - 品牌推荐
  • VSCode插件Claude Code for VSCode配置神马中转API详细教程_AI编程工具推荐_ClaudeCode中转API推荐
  • 6款靠谱降AIGC软件 合规程度拉满
  • 2026年5月上海搬家公司哪家好?推荐五家评测价格透明对比适用场景选择指南 - 品牌推荐
  • 2025-2026年耀华国际学校电话查询:预约探校前请确认学段匹配与资质 - 品牌推荐
  • 电池-底盘一体化的热均匀性:集成时代的“均温难题”
  • CNN 卷积神经网络
  • Sora 2导出WebM失效全解析(元数据污染+时间基错配+Alpha通道静默丢弃三重陷阱)
  • 【26年最新】新高考英语大纲词汇表3500个电子版PDF(含正序版、乱序版和默写版)
  • AI写作辅助软件的合规秘籍:如何界定“合理使用”与学术不端?
  • 2026年5月北京别墅装修公司推荐:十大排名大宅设计防踩雷评测专业价格 - 品牌推荐
  • 2025-2026年全球单细胞测序服务公司推荐:五大专业评测实验流程防污染注意事项市场份额 - 品牌推荐