当前位置：首页 > news >正文

搞不清 LLM / Agent / Skill / MCP / Harness？一张图把 5 个名词的关系讲透

news 2026/5/16 9:56:25

👉这是一个或许对你有用的社群
🐱 一对一交流/面试小册/简历优化/求职解惑，欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料：
《项目实战（视频）》：从书中学，往事上“练”
《互联网高频面试题》：面朝简历学习，春暖花开
《架构 x 系统设计》：摧枯拉朽，掌控面试高频场景题
《精进 Java 学习指南》：系统学习，互联网主流技术栈
《必读 Java 源码专栏》：知其然，知其所以然

👉这是一个或许对你有用的开源项目
国产Star破10w的开源项目，前端包括管理后台、微信小程序，后端支持单体、微服务架构
RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRM、AI大模型、IoT物联网等功能：
多模块：https://gitee.com/zhijiantianya/ruoyi-vue-pro
微服务：https://gitee.com/zhijiantianya/yudao-cloud
视频教程：https://doc.iocoder.cn
【国内首批】支持 JDK17/21+SpringBoot3、JDK8/11+Spring Boot2双版本

新人最容易在这 5 个名词上崩溃
一张图先把关系讲清楚
LLM：什么都读过的"大脑"
Agent：给大脑装上手脚
Skill：Agent 的"具体手艺"
MCP：让 Agent 接外部工具的"USB-C"
Harness：把 AI 调试稳了再上线的"工作台"
一张表收口：5 个概念的层级关系
最后说一句

新人最容易在这 5 个名词上崩溃

最近不少同事问我：「LLM、Agent、Skill、MCP、Harness——这一堆词到底什么关系？谁包谁、谁调谁？」

打开任意一篇 AI 文章，5 个词混着用：一会儿说 Agent 调用 MCP，一会儿说 LLM 跑 Skill，一会儿又冒出 Harness。单个词都能查到定义，但放一起就糊了。

问题不在概念本身——问题在大家解释概念时，只讲是什么、不讲谁依赖谁。这一篇用一张图把 5 者的依赖关系画出来，再用大白话挨个 30 秒讲清楚。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址：https://github.com/YunaiV/ruoyi-vue-pro
视频教程：https://doc.iocoder.cn/video/

一张图先把关系讲清楚

记住一条主线：LLM 是大脑，Agent 是身体，Skill 是手艺，MCP 是接口，Harness 是工作台。

概念	在体系里扮演什么	依赖谁
LLM	大脑（只会想）	无
Agent	身体（手脚都全）	LLM
Skill	一项手艺	Agent
MCP	工具的统一插头	Agent + 外部工具
Harness	调试 / 跑评测的工作台	上面 4 个

下面挨个讲，每个 30 秒搞定。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址：https://github.com/YunaiV/yudao-cloud
视频教程：https://doc.iocoder.cn/video/

LLM：什么都读过的"大脑"

LLM= Large Language Model，大语言模型。

可以理解成一个什么书都翻过的学霸——你问什么它都能答，但它只会动嘴：不会查数据库、不会发邮件、不会执行命令。

举例：你问 GPT-4「今天北京天气怎么样」，它会承认「我没法实时联网」——它能聊天气知识，但没法主动去查。

LLM 是底座，剩下 4 个名词都是为了让 LLM 真的能干活搭出来的。

Agent：给大脑装上手脚

Agent= 智能体，等于 LLM + 一组可调用的工具 + 自主决策循环。

还是「查天气发邮件」的例子：

LLM 自己只会回答「我不知道」；
Agent 会拆任务——先调天气 API、再调邮件 API、最后写一段总结发出去。

整个过程的关键是Agent Loop：每一步都让 LLM 看一眼当前状态，决定下一步调什么工具，反复跑直到任务完成。Claude Code、Cursor、OpenHands 这些都是 Agent 的具体实现。

判断标准——能"自己决定下一步做什么"的，就是 Agent；只会回答问题的，是 LLM。

Skill：Agent 的"具体手艺"

Skill= Agent 会的一项具体活，封装一个完整的工作流。

比如：

「审一个 PR 的 Skill」——读 diff、检查规范、给评论；
「生成 Vue 组件的 Skill」——按团队规范出代码；
「写微信公众号的 Skill」——按公众号风格改写文章（就是这篇文章用的）。

Skill vs Agent：Agent 是引擎，Skill 是「这个引擎会哪些套路」。一个 Agent 可以有几十上百个 Skill——用到哪个加载哪个，按需触发，不占上下文。

具体到 Claude Code：每个 Skill 就是一个SKILL.md文件，写清「什么时候用、怎么用」，Claude 自己识别匹配，不需要你手动喊。

MCP：让 Agent 接外部工具的"USB-C"

MCP= Model Context Protocol，模型上下文协议——Anthropic 推的开放标准。

它解决的是一个工程问题：Agent 要调外部工具（GitHub、Notion、Slack、数据库），怎么调？

没有 MCP 之前——每个工具都得写一套适配代码；接 GitHub 写一份、接 Notion 写一份、接 Slack 再写一份；
有了 MCP 之后——工具方按 MCP 规范暴露接口，Agent 端插上就能用，跟 USB-C 一样。

类比理解——MCP 之于 Agent，就像 HTTP 之于浏览器：一个统一协议把"百花齐放的工具"和"统一调用的客户端"对接起来。

现在 GitHub、Notion、Slack、Sentry、阿里云 OSS、Linear 这些主流服务都已经有官方或社区的 MCP Server，Agent 拿来即用。

Harness：把 AI 调试稳了再上线的"工作台"

Harness= AI 应用的开发 / 测试 / 评测平台——把 AI 应用打磨稳了再上线的"工作台"。

把上面 4 个东西（LLM / Agent / Skill / MCP）拼起来真要落到生产里，会冒出一堆问题：

怎么知道 Agent 答得对不对？
怎么跑回归测试？（提示词改一下，几百个 case 要重跑）
怎么追踪 token 消耗、延迟、失败率？
怎么对比不同模型 / 不同提示词的效果？

Harness 就是干这个的——把"AI 跑通"和"AI 跑稳"这两件事分开：跑通靠 Agent + Skill + MCP，跑稳靠 Harness。

代表性的工具：LangSmith、Helicone、OpenAI Evals、Anthropic 内部的 Symphony / 评测框架，以及国内的 Dify、FastGPT 等也带轻量级 Harness 能力。

判断标准——想让 AI 应用"上生产关键链路"，Harness 是绕不开的一环。

一张表收口：5 个概念的层级关系

层级	概念	一句话	没它会怎样
底座	LLM	大脑，只会想	啥也没有
执行体	Agent	LLM + 工具 + 决策循环	只能聊天，不能干活
能力包	Skill	Agent 的具体手艺，按需加载	啥都得当场临时写
工具协议	MCP	Agent 调外部服务的 USB-C 接口	每接一个工具写一套代码
质量保障	Harness	调试 + 评测 + 监控的工作台	上线靠玄学，bug 靠用户报

学习顺序建议——从下往上一层一层来：先搞清 LLM 是什么、再玩 Agent（用 Claude Code 上手最快）、再尝试写 Skill 和接 MCP、最后想往生产里塞才碰 Harness。跳着学最容易把自己绕晕。

最后说一句

5 个名词放一起一定要看清楚两件事：

LLM、Agent、Skill 是"实体"——它们是真实存在的代码 / 模型；
MCP、Harness 是"基础设施"——前者是接外部工具的协议，后者是开发它们的工作台。

一句话总结：

LLM 是脑、Agent 是身、Skill 是手艺、MCP 是插头、Harness 是工作间——五个角色各司其职，AI 应用才跑得起来、跑得稳。

欢迎加入我的知识星球，全面提升技术能力。

👉 加入方式，“长按”或“扫描”下方二维码噢：

星球的内容包括：项目实战、面试招聘、源码解析、学习路线。

文章有帮助的话，在看，转发吧。 谢谢支持哟 (*^__^*）

查看全文

http://www.jsqmd.com/news/827472/

从自动化到智能代理：构建家庭智能中枢的架构与实践

如何用res-downloader快速下载全网视频资源：终极免费指南

从像素到亚像素：InSAR图像配准的核心算法与精度跃迁

如何快速掌握DriverStore Explorer：Windows驱动管理终极指南

观察 Taotoken 用量看板如何清晰呈现各模型 API 调用成本

3分钟掌握网页视频下载：Chrome扩展VideoDownloadHelper完全指南

PTA数据结构实战：层次遍历巧解二叉树叶结点输出

OpenMV4 H7 + MSP430F5529 循迹小车避坑指南：从色块阈值调试到WiFi图传稳定连接

告别源码编译焦虑：我的zlib-1.2.11和libpng-1.6.36通用编译脚本进化史

【USB笔记】配置描述符：从协议解析到实战抓包

联想E14升级BIOS踩坑实录：改开机Logo时，那个‘安全回滚预防’报错怎么破？

2026年薪酬绩效与组织设计十大知名咨询公司推荐，靠谱机构排名及核心优势 - 远大方略管理咨询

从英文界面到母语设计：FigmaCN如何改变你的设计工作流

闲置武商一卡通如何快速回收？五大技巧值得收藏！ - 团团收购物卡回收

Windows驱动存储清理指南：用DriverStore Explorer找回被占用的磁盘空间

证件照怎样换底色？证件照背景颜色怎么改？2026 实测常用APP与微信小程序完全指南 - AI测评专家

ADC0809CCN实战指南：从引脚解析到51单片机驱动

终极LXMusic音源配置指南：5步实现专业级音乐播放解决方案

学妹问降AI率工具选哪个性价比最高？4款降AI软件1万字花多少过AIGC检测

激光位移传感器安装：从能用迈向精准的关键工艺与避坑指南

从空调遥控到智能家居：深入浅出聊聊NEC红外协议的那些‘潜规则’与兼容性坑

终极指南：如何用Reset-Windows-Update-Tool快速修复Windows更新故障

终极解决方案：3分钟实现QQ音乐加密文件自由转换

浏览器扩展开发实战：用Ctrl+Enter优化AI对话工具交互体验

大语言模型硬件加速器的容错技术与实践

面试准备

PSIM 9.0 手把手教学：从零搭建直流电机双闭环调速模型（附完整代码与波形分析）

LabVIEW玩转ST-Link：除了烧录，这些CLI隐藏命令让你的调试效率翻倍

酒店一次性用品采购：五个常见问题与供应商筛选参考 - 资讯速览