当前位置: 首页 > news >正文

AI进阶三境界:从聊天框到专家团队,你处于哪一层?

文章将使用AI的方式分为三个层级:第一层是基础聊天框,仅用于简单问答;第二层是通过Agent平台实现任务自动化;第三层是利用中央调度系统,由专家Agent团队协作完成复杂任务。文章深入解析了Agent的运作机制,将其比作“挽具”,由“多次请求提示词”、“上下文记忆系统”和“工具集合(Skill、CLI、MCP)”三部分构成,并详细阐述了这三部分如何协同工作,使AI从“只能聊天”转变为“能干活的工具”。文章强调,用好AI的关键在于清晰的问题定义和合适的工具选择,并指出未来Chatbot和Agent将互相融合,形成更高阶的形态。


我观察了身边的人用 AI,大致可以分成三个层级。

第一层:把 AI 当聊天框

打开 ChatGPT , Claude ,Deepseek,Kimi,豆包的对话框,直接跟它聊天,让它帮你解决问题。你问一句,它答一句。写文案、翻译、总结文章,都在一个聊天框里完成。这是最普遍的状态。AI 是个顾问,动嘴不动手。

第二层:开始使用 Agent 平台

你不只是跟 AI 聊天了,而是通过一个中介,让它帮你干活。你跟中介说个目标,中介在后台自己查资料、调工具、检查结果,最后把成品交给你。你从“提问者”变成了“发包方”。

第三层:使用中央调度系统

比如 OpenClaw、WorkBuddy 这种,调度一群 AI 帮你干活。这已经不是雇一个中介了,是雇了一个项目经理。项目经理自己拆任务,分配给下面专门写代码的、专门搜资料的、专门验收的专家 Agent,最后给你交付成品。你只需要定方向、验结果。

大部分人在第一层,少部分人在第二层,第三层。

那 Agent 到底是什么?中介怎么干活的?专家团又是什么?我琢磨了很久,才有了下面这些想法。

以下是个人的理解,以最通俗易懂的方式解释,有些解释可能不是特别专业,大家重在理解什么是 Agent 就行。

01 AI 一开始就是个聊天框

最开始的 AI,就是个 Chatbot。

你跟它打字说话,它理解你的意思,然后给你回复。你问一句,它答一句。你继续追问,它继续回答。就这么简单。

这时候的 AI 不能干活,不能联网查东西,不能操作电脑,不能调工具。它就是个聊天的对象,像个顾问,你问它啥,它给你出出主意。但真正要动手做的事,还是得你自己来。

后来 Chatbot 开始升级了。它能联网搜索了,能读文件了,能写代码了,上下文窗口也越来越大。还加上了思考模式,让它在回答之前先自己琢磨一下。

这时候的 Chatbot,其实已经在向 Agent 的方向走了。它不再只是动嘴,开始能动手了。

02 Agent 就是中介

Agent 是什么?我的理解很简单:Agent这个词是代理意思,换种说法 就是中介。

以前我们是直接跟大模型对话。你一句,我一句。大模型只有嘴,没有手。

现在不一样了。我们不是直接跟大模型说话了,我们是跟 Agent 这个中介说话。

你跟中介说一个目标,比如“帮我调研某某的竞品,写份报告,以下是我的需求”。然后你就不用管了,坐沙发上等着就行。

中介在后台干嘛呢?

  • 第一步 它转身去问大模型:“客户要调研某某的竞品,需要什么信息?这是需求”。
  • 第二步 大模型说:“我需要竞品 A 和 B 的最新定价。”
  • 第三步 中介自己上网搜,搜到一堆资料。
  • 第四步 中介把资料整理好,又去找大模型:“给你资料,开始分析。”
  • 第五步 大模型分析完了,给出结论。
  • 第六步 中介拿着结论,去找另一个专门写报告的大模型:“帮我写成报告。”
  • 第七步 中介拿到报告,自己先检查一遍,格式不对的改一下,逻辑漏洞的补一下。
  • 最后 中介把成品递给你:“老板,报告写好了。”

从头到尾,你只跟中介说了一句话。中介在后台跟大模型来回沟通了七八次。

Agent 这个中介,把大模型从“只能聊天”变成了“能干活的工具”。

03 Agent 本身就是一套 Harness

那这个中介到底是什么?它本质上就是一套 Harness (挽具)。

大模型是那匹马。它只有脑子和嘴,没有手,没有记性,不会自己规划步骤。

Agent 就是套在马身上的缰绳、马鞍、马镫。它告诉马往哪走、什么时候停、什么时候加速。

它给马装上工具,让马不仅能想能说,还能查、能算、能写、能验证。

Agent = 大模型 + Harness

模型是引擎,Harness 是整车的控制系统。

没有 Harness,大模型只是一个会聊天的脑子。有了 Harness,它才能变成一个能干活、能闭环、能自我修正的执行者。

同一个大模型,套上不同的 Agent(不同的挽具),就会变成完全不同的工具。

  • 套上 Claude Code 的挽具,它就是个编程助手。
  • 套上 ChatGPT 的挽具,它就是个通用聊天工具。
  • 套上你自己写的挽具,它就是你专属的私人助理。

模型没变,变的是挽具。

那这套 Harness 到底由什么组成?

我把它总结成了一个公式:

Agent 的

Harness = 多次请求提示词 + 上下文的记忆系统 + 工具集合

工具集合包括 Skill、CLI、MCP。

这三个组件,就是挽具的全部家当。

多次请求提示词

这是挽具的“运行节奏”。它决定了 Agent 怎么拆任务、什么时候调工具、什么时候检查结果。不是一次性丢给大模型,而是一步一步来。

上下文的记忆系统

这是挽具的“信息管道”。负责记住每一步的结果,把关键信息装进新的上下文喂给大模型,同时对抗中段遗忘和上下文污染。

工具集合(Skill、CLI、MCP)

这是挽具的“执行手臂”。Skill 是自动化流程模组,MCP 是标准化外部服务接口,CLI 是兜底的命令行。

没有工具,Agent 就只能动嘴不能动手。三样东西组合在一起,就是一套完整的挽具。套上它,大模型这匹马才能稳定地跑完全程。下面我们一个个拆开看。

04 组件一:多次请求提示词

中介为什么能搞定复杂任务?靠的就是 Harness 里的第一个组件: 多次请求 。

单次请求就像让一个人看了一眼问题就必须马上给出完整答案,中间不能查资料、不能验算、不能修改。复杂任务这样搞,质量一定差。

中介的做法不一样。它把一个大任务拆成多个小步骤,每一步都单独跟大模型沟通一次:

  • 第一次 理解目标,拆任务。
  • 第二次 问大模型需要什么信息,然后去搜。
  • 第三次 把搜到的信息喂给大模型,让它分析。
  • 第四次 把分析结果给大模型,让它写报告。
  • 第五次 检查报告,有问题就再改一轮。

每一轮的结果都被装进新的上下文,喂给模型再思考。这就是“结果回传”的自动化版本。不用你手动去喂,中介自己就循环起来了。

中介还有一个聪明的地方:

它不会一次性把所有信息都塞给大模型。一次性全塞进去,大模型反而不知道该关注什么,容易跑偏。中介的做法是渐进式披露,每一步只给大模型看它当前需要的东西。

搜索时只看搜索结果,写代码时只看代码需求,验收时只看验收标准。信息是一层一层打开的,大模型每一步的注意力都很聚焦。

多次请求是手段,渐进式披露是策略,Skill 的完整执行是目的。

也就是你要使用 Skill,除了选大模型之外,还需要选对应合适的 Agent 工具。

05 组件二:上下文的记忆系统

AI 的记忆是有限的。对话越长,它越不可能每一句话都平等记住。尤其在长对话里,它容易记住开头和结尾,忽略中间。

Agent 的 Harness 里专门有一套机制来管这个事。这就是公式里的第二个组件: 上下文的记忆系统 。

这套系统做三件事:

  • 第一,记住关键信息。
  • 每完成一步,把重要的结论、数据、用户偏好记录下来,装进新的上下文里。
  • 第二,对抗中段遗忘。
  • 对话长了,把关键约束重新提到前面来,或者让大模型先做总结再开新窗口继续。
  • 第三,防止上下文污染。
  • 不相关的东西不塞进去,只给大模型看当前这一步需要的材料。

所以你不能指望 AI 自己管好所有信息,Harness 要替它管。这就是公式里“上下文的记忆系统”的价值。信息管道越干净,大模型的判断越稳定。

要避免 Agent 出现幻觉,就要警惕上下文污染的问题。

06 组件三:工具集合——调工具之前先“握手”

中介工具箱里最常用的三种装备,就是 Skill 、 MCP 和 CLI 。

但中介调用 MCP 工具之前,不是上来就直接用的。它要先跟 MCP 服务端走一个“互相认识”的流程。这个流程刚好也是三步,可以理解成应用层的“三次握手”:

  • 第一步,中介自报家门。
  • 中介先发一个请求给 MCP 服务端,告诉对方自己支持的协议版本、有哪些能力。(以 JSON-RPC 协议)
  • 第二步,服务端亮底牌。
  • MCP 服务端收到后,返回自己的信息,确认协议版本,并列出自己能提供什么工具和资源,比如能访问数据库、能读网页内容。
  • 第三步,中介确认,握手完成。
  • 中介收到服务端的底牌后,再发一个确认通知过去,说“我知道你能干什么了,我也准备好了”。到此握手结束,双方正式开始干活。

这个过程跟网络层的 TCP 三次握手不一样。TCP 的三次握手是为了建立网络连接,发生在底层。MCP 的握手发生在应用层,目的是强制双方在干活之前先把能力对齐。

TCP 管连通,MCP 管能力。

中介知道服务端能干什么,服务端也知道中介要按什么标准来,后面才不会出乱子。

这其实也印证了 Harness 工程的思路:好的控制系统,不仅要管“怎么干”,还要管“干之前先把规矩定清楚”。

07 握手之后,怎么干活?

握手成功之后,Agent 和 MCP 服务端就进入了正式的干活阶段。这个过程就是“多次请求”和“结果回传”在工具调用中的具体体现。

整个过程可以概括为三步循环: 下指令 → 去执行 → 看结果 。

  • 第一步,下指令。
  • 当大模型判断需要调用某个 MCP 工具时,Agent 就向 MCP 服务端发一个请求,里面写清楚要调哪个工具、参数是什么。比如要查天气,就告诉它“调 get_weather,城市是北京”。
  • 第二步,去执行。
  • MCP 服务端收到指令后,就开始干自己的活。它可能会去访问数据库、调第三方 API、或者做计算。这个过程对 Agent 来说是个黑盒,Agent 只需要等结果。
  • 第三步,看结果。
  • 服务端执行完毕后,把结果封装好返回给 Agent。结果里有两样东西:一个是 content,就是实实在在的数据,比如天气信息、数据库查询结果。另一个是 isError,告诉 Agent 这次调用有没有出错。

使用 MCP 也要注意安全问题,因为你并不清楚对方在黑箱子中做了什么,比如说对方在黑箱子中把你的数据同步到对方的邮箱中。

Agent 根据结果判断下一步是继续推进,还是处理报错。

拿到结果后,Agent 就完成了我们之前说的关键步骤:结果回传。它把这个结果装进新的上下文,再次发给大模型。

大模型读一遍结果,然后回答你的问题,或者判断要不要再调一次工具,重复这个循环,直到把事情办妥。

这整个过程,正好印证了 Harness 公式里的三个组件如何协同工作:多次请求是运行节奏,记忆系统负责把结果装进上下文,MCP 工具负责实际执行。

08 Skill 怎么“包含”MCP?

那 Skill 和 MCP 到底是什么关系?Skill 里怎么包含 MCP?

Skill 包含 MCP,不是通过代码调用,而是通过配置声明,然后由 Agent 框架在运行时自动集成。

整个过程分五步走:

  • 第一步,Skill 声明自己要用的 MCP 服务。
  • 在 Skill 的配置文件里,它会写清楚自己需要哪些 MCP 服务,比如要一个能查天气的服务。
  • 第二步,Agent 框架启动时加载 MCP 服务。
  • 当你启动这个 Skill 时,Agent 框架会读配置,然后按照声明去启动对应的 MCP 服务端。启动过程中走一遍我们刚说的“三次握手”。
  • 第三步,MCP 工具被自动注入到大模型的上下文里。
  • 握手成功后,Agent 框架拿到了 MCP 服务端提供的工具清单,比如 get_weather、get_forecast 这些。然后框架把这些工具的描述,自动加入到发给大模型的工具定义里。这一步对 Skill 来说是完全透明的。
  • 第四步,大模型决策,触发 Function Calling。
  • 当任务需要查天气时,大模型看到上下文里有 get_weather 这个工具,就按 Function Calling 的格式输出一个调用指令,告诉 Agent 框架:“帮我调 get_weather,参数是 city: Beijing。”
  • 第五步,Agent 框架通过 MCP 协议执行调用。
  • Agent 框架接收到大模型的指令后,不是自己去直接调天气 API,而是通过 MCP 协议,把这个指令发给 MCP 服务端。服务端执行完,把结果返回给框架,框架再喂回给大模型。

所以整个链路是:

Skill 声明依赖 → Agent 框架加载 MCP 服务并握手 → MCP 工具注入大模型上下文 → 大模型通过 Function Calling 决定调用 → Agent 框架通过 MCP 协议执行 → 结果回传给大模型

三个东西各司其职:Skill 管“我要用什么”,Function Calling 管“现在该用哪个”,MCP 协议管“怎么去执行”。

也就是为什么有人说,未来 Skill “走天下”,因为 Skill 中可以包含 MCP,也可以包含部分上下文记忆。

09 Skill、MCP、CLI 三者的区别

Harness 公式里的工具集合,就是这三样东西。它们到底有什么区别?

我们再用这个比喻,从五个维度拆开细看:

CLI:中介自己动手

CLI 是中介自己动手,直接去敲电脑命令行。它的颗粒度最细,一条命令就是一个操作。操作系统或已安装软件自带的命令,中介拿起来就能用。大模型通过 Function Calling 决定要执行什么命令,Agent 框架直接在终端里跑。

MCP:外部专业服务商

MCP 是中介打电话给一个外部专业服务商,按标准协议下单。它的颗粒度居中,一个 MCP 服务端可以提供多个工具。这些服务端可以是第三方提供的,也可以自己搭建。

Skill:操作手册

Skill 是中介手里的一本操作手册,里面写好了“遇到什么情况,该做什么事”。它的颗粒度最粗,一个 Skill 就是一个完整的任务流程,用户或开发者预先编写好。

三者的层级关系也很好记:

Skill 是最高层级的指挥官,管流程;

MCP 是标准化服务接口,管外部服务;

CLI 是兜底的万能胶,管计算机本身。

所以三者的关系可以总结为: Skill 是任务层的挽具,MCP 是工具层的标准化插头,CLI 是兜底的万能胶。

在 Agent 所有的工具中,CLI 终端的数据是最快的。

CLI > MCP > Skill

原因很简单:流程最短,中间环节最少。

CLI

中介自己站起来,走到电脑前,敲一行命令,回车,结果就出来了。全程就一步。

MCP

中介拿起电话,打给外部服务商,先说“我要查天气,城市是北京”,服务商那边处理完,再把结果报回来。中间多了一层通信。

Skill

中介翻开操作手册,按手册写的步骤,第一步干嘛,第二步干嘛,每一步可能还要调 CLI 或 MCP。流程更长。

CLI 是直接在本机执行,没有网络延迟,没有协议握手,没有额外的通信开销。一条 curl 命令下去,结果马上就回来了。

但是 CLI 虽然快,但是不稳,因为直接 CLI 在终端执行,一旦遇到危险命令,就可能有严重的后果,比如删了你的内容。

使用 MCP 就多了一个“外部服务商”,就相对 CLI 更稳些。

所以得靠优秀的 Agent 平台,基于里面的 Harness 工具,避免出现问题。

飞书在 3 月,公开了官方 CLI。它是为 Agent 而生的 CLI。

官方仓库:https://github.com/larksuite/cli

飞书 CLI 内置 200 多条命令,覆盖了消息、文档、表格等 17 个核心业务,Agent 调用它能省去中间环节,让真实任务跑起来。

如果官方有提供 CLI,并且 CLI 可以解决,优先走 CLI 方式。它是最快,最省,最安全,最稳的方式。

通过数据了解到,相同的处理,MCP 消耗的 Tokens 是 CLI 的 4 到 32 倍。

10 两件事正在同时发生

好玩的地方在于,Chatbot 和 Agent 正在互相靠拢。

一边是 Chatbot 在长“手”和长“脑”,越来越能干。

另一边是 Agent 在学“说话”,本来它是在后台自己跑的,现在为了面向大众用户,把界面又做回了聊天框的样子。

所以你看到的产品,比如现在的 ChatGPT、Claude,已经很难说它到底是 Chatbot 还是 Agent 了。它是个融合体。

所以严格来讲,我的结论是:

Chatbot 本身就是一个 Agent 工具。

Agent 是带有 Chatbot 界面、更集成、可以真正干活的工具。

两者不是两种东西,而是在一条能力光谱上。Chatbot 是起点,Agent 是更高阶的形态。区别就在于自动化程度和能不能自己推着任务往前走。

11 用好 AI,核心是你能不能说清楚问题

很多人以为用 AI 用得好不好,看的是 AI 模型有多强。

其实不是。

更关键的是: 你给 AI 的问题够不够清楚。

AI 是放大器。

你想得清楚,它就能把你的思路放大成更好的方案。

你想得模糊,它就放大这种模糊,给你一堆看起来有道理但没法用的废话。

举个最简单的例子:

你只跟 AI 说“帮我想想怎么发展”,它只能给你泛泛的职业建议。

但如果你说:“我在杭州做了三年运营,手上有个 500 人的活跃社群,想在三个月内通过兼职月入 3000 块。帮我分析三个最可行的方向,每个方向要讲清楚启动成本、风险和第一步具体怎么做。”

它就能给你真正有用的东西。

这就是我一直说的:AI 像一匹马,你是骑手。马有力气跑得快,但它不知道你要去哪里。你不拉缰绳,它就乱跑。你拉对方向,它才能带你到目的地。

01

什么是AI大模型应用开发工程师?

如果说AI大模型是蕴藏着巨大能量的“后台超级能力”,那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。

AI大模型应用开发工程师是基于AI大模型,设计开发落地业务的应用工程师。

这个职业的核心价值,在于打破技术与用户之间的壁垒,把普通人难以理解的算法逻辑、模型参数,转化为人人都能轻松操作的产品形态。

无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能,还是办公场景中的自动记账工具、会议记录用的语音转文字APP,这些看似简单的应用背后,都是应用开发工程师在默默搭建技术与需求之间的桥梁。

他们不追求创造全新的大模型,而是专注于让已有的大模型“听懂”业务需求,“学会”解决具体问题,最终形成可落地、可使用的产品。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

02

AI大模型应用开发工程师的核心职责

需求分析与拆解是工作的起点,也是确保开发不偏离方向的关键。

应用开发工程师需要直接对接业务方,深入理解其核心诉求——不仅要明确“要做什么”,更要厘清“为什么要做”以及“做到什么程度算合格”。

在此基础上,他们会将模糊的业务需求拆解为具体的技术任务,明确每个环节的执行标准,并评估技术实现的可行性,同时定义清晰的核心指标,为后续开发、测试提供依据。

这一步就像建筑前的图纸设计,若出现偏差,后续所有工作都可能白费。

技术选型与适配是衔接需求与开发的核心环节。

工程师需要根据业务场景的特点,选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同,选型的合理性直接影响最终产品的表现。

同时,他们还要对行业相关数据进行预处理,通过提示词工程优化模型输出,或在必要时进行轻量化微调,让基础模型更好地适配具体业务。

此外,设计合理的上下文管理规则确保模型理解连贯需求,建立敏感信息过滤机制保障数据安全,也是这一环节的重要内容。

应用开发与对接则是将方案转化为产品的实操阶段。

工程师会利用选定的开发框架构建应用的核心功能,同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通,确保数据流转顺畅。

在这一过程中,他们还需要配合设计团队打磨前端交互界面,让技术功能以简洁易懂的方式呈现给用户,实现从技术方案到产品形态的转化。

测试与优化是保障产品质量的关键步骤。

工程师会开展全面的功能测试,找出并修复开发过程中出现的漏洞,同时针对模型的响应速度、稳定性等性能指标进行优化。

安全合规性也是测试的重点,需要确保应用符合数据保护、隐私安全等相关规定。

此外,他们还会收集用户反馈,通过调整模型参数、优化提示词等方式持续提升产品体验,让应用更贴合用户实际使用需求。

部署运维与迭代则贯穿产品的整个生命周期。

工程师会通过云服务器或私有服务器将应用部署上线,并实时监控运行状态,及时处理突发故障,确保应用稳定运行。

随着业务需求的变化,他们还需要对应用功能进行迭代更新,同时编写完善的开发文档和使用手册,为后续的维护和交接提供支持。

03

薪资情况与职业价值

市场对这一职业的高度认可,直接体现在薪资待遇上。

据猎聘最新在招岗位数据显示,AI大模型应用开发工程师的月薪最高可达60k。

在AI技术加速落地的当下,这种“技术+业务”的复合型能力尤为稀缺,让该职业成为当下极具吸引力的就业选择。

AI大模型应用开发工程师是AI技术落地的关键桥梁。

他们用专业能力将抽象的技术转化为具体的产品,让大模型的价值真正渗透到各行各业。

随着AI场景化应用的不断深化,这一职业的重要性将更加凸显,也必将吸引更多人才投身其中,推动AI技术更好地服务于社会发展。

CSDN粉丝独家福利

给大家整理了一份AI大模型全套学习资料,这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取【保证100%免费】

http://www.jsqmd.com/news/1071804/

相关文章:

  • 再见RAG!AI知识库还得是SAG,又快又准~
  • Go语言高效学习路线 + 超详细对比C语言(从语法到底层思维)
  • AMDVLK完全指南:如何在Linux上释放Radeon显卡的Vulkan性能潜力
  • Doris详细介绍与使用之查询语法(三)
  • 预测系统的监控与告警:当你的模型开始“静默失效”
  • 终极指南:三步掌握DeepLabCut无标记姿态追踪技术
  • RT-Thread的内核对象管理,设计比你想的巧妙
  • V9数据库替换授权
  • Get Shit Done:彻底解决AI编程上下文衰退问题的元提示工程系统
  • 微信小程序开店找哪家公司,正规靠谱怎么选?
  • 微信小游戏Unity适配方案:5个核心挑战与实战优化策略
  • 数据库视图
  • 我在大厂做Agent落地踩过的那些坑
  • 半小时学会 Python 爬虫:从零爬取知乎实时热榜榜单
  • 一行命令生成 PPT:OfficeCLI 让文档自动化彻底告别 50 行 Python
  • 从钉钉 ONE 到企业版信息流:谁决定你先做什么
  • 企业微信会话存档实战:基于超时提醒机制的自动化响应方案
  • 《超标量处理器设计》- 执行
  • 开源库存管理终极指南:现代化供应链的技术实现方案
  • 小程序分销裂变怎么做?实体门店二级分销落地全流程拆解
  • 基于Python+可视化技术的轻量级Web接口自动化测试平台的设计与实现
  • 上海普陀区老房翻新装修报价清单透明的公司
  • CBCX:把服务体系做扎实,注重效率的使用者更容易感受到的标准
  • Prompt Engineering 过时了?国外程序员开始玩 Loop Engineering
  • 国内通用电商自动化对账解决方案
  • Token计费,正式翻篇了——知医邦AI产品最新定价到底怎么算?
  • CBCX外汇在在线支持上靠谱吗?
  • 阿里Java面试速成指南:2026程序员短期突击必备!
  • Relique:消费者 RWA 正在兴起,卡牌、球鞋、手表和收藏品上链趋势分析
  • 《Forensic Investigation of Smart Digital Devices: A Hands-on Guide》导读:取证脊柱 + 设备地图 + 工具对照