搞不清 LLM / Agent / Skill / MCP / Harness?一张图把 5 个名词的关系讲透
👉这是一个或许对你有用的社群
🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料:
《项目实战(视频)》:从书中学,往事上“练”
《互联网高频面试题》:面朝简历学习,春暖花开
《架构 x 系统设计》:摧枯拉朽,掌控面试高频场景题
《精进 Java 学习指南》:系统学习,互联网主流技术栈
《必读 Java 源码专栏》:知其然,知其所以然
👉这是一个或许对你有用的开源项目
国产Star破10w的开源项目,前端包括管理后台、微信小程序,后端支持单体、微服务架构
RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRM、AI大模型、IoT物联网等功能:
多模块:https://gitee.com/zhijiantianya/ruoyi-vue-pro
微服务:https://gitee.com/zhijiantianya/yudao-cloud
视频教程:https://doc.iocoder.cn
【国内首批】支持 JDK17/21+SpringBoot3、JDK8/11+Spring Boot2双版本
新人最容易在这 5 个名词上崩溃
一张图先把关系讲清楚
LLM:什么都读过的"大脑"
Agent:给大脑装上手脚
Skill:Agent 的"具体手艺"
MCP:让 Agent 接外部工具的"USB-C"
Harness:把 AI 调试稳了再上线的"工作台"
一张表收口:5 个概念的层级关系
最后说一句
新人最容易在这 5 个名词上崩溃
最近不少同事问我:「LLM、Agent、Skill、MCP、Harness——这一堆词到底什么关系?谁包谁、谁调谁?」
打开任意一篇 AI 文章,5 个词混着用:一会儿说 Agent 调用 MCP,一会儿说 LLM 跑 Skill,一会儿又冒出 Harness。单个词都能查到定义,但放一起就糊了。
问题不在概念本身——问题在大家解释概念时,只讲是什么、不讲谁依赖谁。这一篇用一张图把 5 者的依赖关系画出来,再用大白话挨个 30 秒讲清楚。
基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址:https://github.com/YunaiV/ruoyi-vue-pro
视频教程:https://doc.iocoder.cn/video/
一张图先把关系讲清楚
记住一条主线:LLM 是大脑,Agent 是身体,Skill 是手艺,MCP 是接口,Harness 是工作台。
概念 | 在体系里扮演什么 | 依赖谁 |
|---|---|---|
| LLM | 大脑(只会想) | 无 |
| Agent | 身体(手脚都全) | LLM |
| Skill | 一项手艺 | Agent |
| MCP | 工具的统一插头 | Agent + 外部工具 |
| Harness | 调试 / 跑评测的工作台 | 上面 4 个 |
下面挨个讲,每个 30 秒搞定。
基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址:https://github.com/YunaiV/yudao-cloud
视频教程:https://doc.iocoder.cn/video/
LLM:什么都读过的"大脑"
LLM= Large Language Model,大语言模型。
可以理解成一个什么书都翻过的学霸——你问什么它都能答,但它只会动嘴:不会查数据库、不会发邮件、不会执行命令。
举例:你问 GPT-4「今天北京天气怎么样」,它会承认「我没法实时联网」——它能聊天气知识,但没法主动去查。
LLM 是底座,剩下 4 个名词都是为了让 LLM 真的能干活搭出来的。
Agent:给大脑装上手脚
Agent= 智能体,等于 LLM + 一组可调用的工具 + 自主决策循环。
还是「查天气发邮件」的例子:
LLM 自己只会回答「我不知道」;
Agent 会拆任务——先调天气 API、再调邮件 API、最后写一段总结发出去。
整个过程的关键是Agent Loop:每一步都让 LLM 看一眼当前状态,决定下一步调什么工具,反复跑直到任务完成。Claude Code、Cursor、OpenHands 这些都是 Agent 的具体实现。
判断标准——能"自己决定下一步做什么"的,就是 Agent;只会回答问题的,是 LLM。
Skill:Agent 的"具体手艺"
Skill= Agent 会的一项具体活,封装一个完整的工作流。
比如:
「审一个 PR 的 Skill」——读 diff、检查规范、给评论;
「生成 Vue 组件的 Skill」——按团队规范出代码;
「写微信公众号的 Skill」——按公众号风格改写文章(就是这篇文章用的)。
Skill vs Agent:Agent 是引擎,Skill 是「这个引擎会哪些套路」。一个 Agent 可以有几十上百个 Skill——用到哪个加载哪个,按需触发,不占上下文。
具体到 Claude Code:每个 Skill 就是一个SKILL.md文件,写清「什么时候用、怎么用」,Claude 自己识别匹配,不需要你手动喊。
MCP:让 Agent 接外部工具的"USB-C"
MCP= Model Context Protocol,模型上下文协议——Anthropic 推的开放标准。
它解决的是一个工程问题:Agent 要调外部工具(GitHub、Notion、Slack、数据库),怎么调?
没有 MCP 之前——每个工具都得写一套适配代码;接 GitHub 写一份、接 Notion 写一份、接 Slack 再写一份;
有了 MCP 之后——工具方按 MCP 规范暴露接口,Agent 端插上就能用,跟 USB-C 一样。
类比理解——MCP 之于 Agent,就像 HTTP 之于浏览器:一个统一协议把"百花齐放的工具"和"统一调用的客户端"对接起来。
现在 GitHub、Notion、Slack、Sentry、阿里云 OSS、Linear 这些主流服务都已经有官方或社区的 MCP Server,Agent 拿来即用。
Harness:把 AI 调试稳了再上线的"工作台"
Harness= AI 应用的开发 / 测试 / 评测平台——把 AI 应用打磨稳了再上线的"工作台"。
把上面 4 个东西(LLM / Agent / Skill / MCP)拼起来真要落到生产里,会冒出一堆问题:
怎么知道 Agent 答得对不对?
怎么跑回归测试?(提示词改一下,几百个 case 要重跑)
怎么追踪 token 消耗、延迟、失败率?
怎么对比不同模型 / 不同提示词的效果?
Harness 就是干这个的——把"AI 跑通"和"AI 跑稳"这两件事分开:跑通靠 Agent + Skill + MCP,跑稳靠 Harness。
代表性的工具:LangSmith、Helicone、OpenAI Evals、Anthropic 内部的 Symphony / 评测框架,以及国内的 Dify、FastGPT 等也带轻量级 Harness 能力。
判断标准——想让 AI 应用"上生产关键链路",Harness 是绕不开的一环。
一张表收口:5 个概念的层级关系
层级 | 概念 | 一句话 | 没它会怎样 |
|---|---|---|---|
| 底座 | LLM | 大脑,只会想 | 啥也没有 |
| 执行体 | Agent | LLM + 工具 + 决策循环 | 只能聊天,不能干活 |
| 能力包 | Skill | Agent 的具体手艺,按需加载 | 啥都得当场临时写 |
| 工具协议 | MCP | Agent 调外部服务的 USB-C 接口 | 每接一个工具写一套代码 |
| 质量保障 | Harness | 调试 + 评测 + 监控的工作台 | 上线靠玄学,bug 靠用户报 |
学习顺序建议——从下往上一层一层来:先搞清 LLM 是什么、再玩 Agent(用 Claude Code 上手最快)、再尝试写 Skill 和接 MCP、最后想往生产里塞才碰 Harness。跳着学最容易把自己绕晕。
最后说一句
5 个名词放一起一定要看清楚两件事:
LLM、Agent、Skill 是"实体"——它们是真实存在的代码 / 模型;
MCP、Harness 是"基础设施"——前者是接外部工具的协议,后者是开发它们的工作台。
一句话总结:
LLM 是脑、Agent 是身、Skill 是手艺、MCP 是插头、Harness 是工作间——五个角色各司其职,AI 应用才跑得起来、跑得稳。
欢迎加入我的知识星球,全面提升技术能力。
👉 加入方式,“长按”或“扫描”下方二维码噢:
星球的内容包括:项目实战、面试招聘、源码解析、学习路线。
文章有帮助的话,在看,转发吧。 谢谢支持哟 (*^__^*)