当前位置: 首页 > news >正文

搞不清 LLM / Agent / Skill / MCP / Harness?一张图把 5 个名词的关系讲透

👉这是一个或许对你有用的社群

🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料:

  • 《项目实战(视频)》:从书中学,往事上“练”

  • 《互联网高频面试题》:面朝简历学习,春暖花开

  • 《架构 x 系统设计》:摧枯拉朽,掌控面试高频场景题

  • 《精进 Java 学习指南》:系统学习,互联网主流技术栈

  • 《必读 Java 源码专栏》:知其然,知其所以然

👉这是一个或许对你有用的开源项目

国产Star破10w的开源项目,前端包括管理后台、微信小程序,后端支持单体、微服务架构

RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRMAI大模型、IoT物联网等功能:

  • 多模块:https://gitee.com/zhijiantianya/ruoyi-vue-pro

  • 微服务:https://gitee.com/zhijiantianya/yudao-cloud

  • 视频教程:https://doc.iocoder.cn

【国内首批】支持 JDK17/21+SpringBoot3、JDK8/11+Spring Boot2双版本

  • 新人最容易在这 5 个名词上崩溃

  • 一张图先把关系讲清楚

  • LLM:什么都读过的"大脑"

  • Agent:给大脑装上手脚

  • Skill:Agent 的"具体手艺"

  • MCP:让 Agent 接外部工具的"USB-C"

  • Harness:把 AI 调试稳了再上线的"工作台"

  • 一张表收口:5 个概念的层级关系

  • 最后说一句


新人最容易在这 5 个名词上崩溃

最近不少同事问我:「LLM、Agent、Skill、MCP、Harness——这一堆词到底什么关系?谁包谁、谁调谁?

打开任意一篇 AI 文章,5 个词混着用:一会儿说 Agent 调用 MCP,一会儿说 LLM 跑 Skill,一会儿又冒出 Harness。单个词都能查到定义,但放一起就糊了

问题不在概念本身——问题在大家解释概念时,只讲是什么、不讲谁依赖谁。这一篇用一张图把 5 者的依赖关系画出来,再用大白话挨个 30 秒讲清楚。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro

  • 视频教程:https://doc.iocoder.cn/video/

一张图先把关系讲清楚

记住一条主线:LLM 是大脑,Agent 是身体,Skill 是手艺,MCP 是接口,Harness 是工作台

概念

在体系里扮演什么

依赖谁

LLM

大脑(只会想)

Agent

身体(手脚都全)

LLM

Skill

一项手艺

Agent

MCP

工具的统一插头

Agent + 外部工具

Harness

调试 / 跑评测的工作台

上面 4 个

下面挨个讲,每个 30 秒搞定。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud

  • 视频教程:https://doc.iocoder.cn/video/

LLM:什么都读过的"大脑"

LLM= Large Language Model,大语言模型。

可以理解成一个什么书都翻过的学霸——你问什么它都能答,但它只会动嘴:不会查数据库、不会发邮件、不会执行命令。

举例:你问 GPT-4「今天北京天气怎么样」,它会承认「我没法实时联网」——它能聊天气知识,但没法主动去查。

LLM 是底座,剩下 4 个名词都是为了让 LLM 真的能干活搭出来的。

Agent:给大脑装上手脚

Agent= 智能体,等于 LLM + 一组可调用的工具 + 自主决策循环。

还是「查天气发邮件」的例子:

  • LLM 自己只会回答「我不知道」;

  • Agent 会拆任务——先调天气 API、再调邮件 API、最后写一段总结发出去

整个过程的关键是Agent Loop:每一步都让 LLM 看一眼当前状态,决定下一步调什么工具,反复跑直到任务完成。Claude Code、Cursor、OpenHands 这些都是 Agent 的具体实现。

判断标准——能"自己决定下一步做什么"的,就是 Agent;只会回答问题的,是 LLM。

Skill:Agent 的"具体手艺"

Skill= Agent 会的一项具体活,封装一个完整的工作流。

比如:

  • 「审一个 PR 的 Skill」——读 diff、检查规范、给评论;

  • 「生成 Vue 组件的 Skill」——按团队规范出代码;

  • 「写微信公众号的 Skill」——按公众号风格改写文章(就是这篇文章用的)。

Skill vs Agent:Agent 是引擎,Skill 是「这个引擎会哪些套路」。一个 Agent 可以有几十上百个 Skill——用到哪个加载哪个,按需触发,不占上下文。

具体到 Claude Code:每个 Skill 就是一个SKILL.md文件,写清「什么时候用、怎么用」,Claude 自己识别匹配,不需要你手动喊。

MCP:让 Agent 接外部工具的"USB-C"

MCP= Model Context Protocol,模型上下文协议——Anthropic 推的开放标准。

它解决的是一个工程问题:Agent 要调外部工具(GitHub、Notion、Slack、数据库),怎么调?

  • 没有 MCP 之前——每个工具都得写一套适配代码;接 GitHub 写一份、接 Notion 写一份、接 Slack 再写一份;

  • 有了 MCP 之后——工具方按 MCP 规范暴露接口,Agent 端插上就能用,跟 USB-C 一样。

类比理解——MCP 之于 Agent,就像 HTTP 之于浏览器:一个统一协议把"百花齐放的工具"和"统一调用的客户端"对接起来。

现在 GitHub、Notion、Slack、Sentry、阿里云 OSS、Linear 这些主流服务都已经有官方或社区的 MCP Server,Agent 拿来即用。

Harness:把 AI 调试稳了再上线的"工作台"

Harness= AI 应用的开发 / 测试 / 评测平台——把 AI 应用打磨稳了再上线的"工作台"。

把上面 4 个东西(LLM / Agent / Skill / MCP)拼起来真要落到生产里,会冒出一堆问题:

  • 怎么知道 Agent 答得对不对?

  • 怎么跑回归测试?(提示词改一下,几百个 case 要重跑)

  • 怎么追踪 token 消耗、延迟、失败率?

  • 怎么对比不同模型 / 不同提示词的效果?

Harness 就是干这个的——把"AI 跑通"和"AI 跑稳"这两件事分开:跑通靠 Agent + Skill + MCP,跑稳靠 Harness。

代表性的工具:LangSmith、Helicone、OpenAI Evals、Anthropic 内部的 Symphony / 评测框架,以及国内的 Dify、FastGPT 等也带轻量级 Harness 能力。

判断标准——想让 AI 应用"上生产关键链路",Harness 是绕不开的一环

一张表收口:5 个概念的层级关系

层级

概念

一句话

没它会怎样

底座LLM

大脑,只会想

啥也没有

执行体Agent

LLM + 工具 + 决策循环

只能聊天,不能干活

能力包Skill

Agent 的具体手艺,按需加载

啥都得当场临时写

工具协议MCP

Agent 调外部服务的 USB-C 接口

每接一个工具写一套代码

质量保障Harness

调试 + 评测 + 监控的工作台

上线靠玄学,bug 靠用户报

学习顺序建议——从下往上一层一层来:先搞清 LLM 是什么、再玩 Agent(用 Claude Code 上手最快)、再尝试写 Skill 和接 MCP、最后想往生产里塞才碰 Harness。跳着学最容易把自己绕晕

最后说一句

5 个名词放一起一定要看清楚两件事:

  • LLM、Agent、Skill 是"实体"——它们是真实存在的代码 / 模型;

  • MCP、Harness 是"基础设施"——前者是接外部工具的协议,后者是开发它们的工作台。

一句话总结:

LLM 是脑、Agent 是身、Skill 是手艺、MCP 是插头、Harness 是工作间——五个角色各司其职,AI 应用才跑得起来、跑得稳。


欢迎加入我的知识星球,全面提升技术能力。

👉 加入方式,长按”或“扫描”下方二维码噢

星球的内容包括:项目实战、面试招聘、源码解析、学习路线。

文章有帮助的话,在看,转发吧。 谢谢支持哟 (*^__^*)
http://www.jsqmd.com/news/827472/

相关文章:

  • 从自动化到智能代理:构建家庭智能中枢的架构与实践
  • 如何用res-downloader快速下载全网视频资源:终极免费指南
  • 从像素到亚像素:InSAR图像配准的核心算法与精度跃迁
  • 如何快速掌握DriverStore Explorer:Windows驱动管理终极指南
  • 观察 Taotoken 用量看板如何清晰呈现各模型 API 调用成本
  • 2026人力资源体系搭建靠谱公司推荐,头部咨询机构专业排名及核心优势 - 远大方略管理咨询
  • 3分钟掌握网页视频下载:Chrome扩展VideoDownloadHelper完全指南
  • PTA数据结构实战:层次遍历巧解二叉树叶结点输出
  • OpenMV4 H7 + MSP430F5529 循迹小车避坑指南:从色块阈值调试到WiFi图传稳定连接
  • 告别源码编译焦虑:我的zlib-1.2.11和libpng-1.6.36通用编译脚本进化史
  • 【USB笔记】配置描述符:从协议解析到实战抓包
  • 联想E14升级BIOS踩坑实录:改开机Logo时,那个‘安全回滚预防’报错怎么破?
  • 2026年薪酬绩效与组织设计十大知名咨询公司推荐,靠谱机构排名及核心优势 - 远大方略管理咨询
  • 从英文界面到母语设计:FigmaCN如何改变你的设计工作流
  • 闲置武商一卡通如何快速回收?五大技巧值得收藏! - 团团收购物卡回收
  • Windows驱动存储清理指南:用DriverStore Explorer找回被占用的磁盘空间
  • 证件照怎样换底色?证件照背景颜色怎么改?2026 实测常用APP与微信小程序完全指南 - AI测评专家
  • ADC0809CCN实战指南:从引脚解析到51单片机驱动
  • 终极LXMusic音源配置指南:5步实现专业级音乐播放解决方案
  • 学妹问降AI率工具选哪个性价比最高?4款降AI软件1万字花多少过AIGC检测
  • 激光位移传感器安装:从能用迈向精准的关键工艺与避坑指南
  • 从空调遥控到智能家居:深入浅出聊聊NEC红外协议的那些‘潜规则’与兼容性坑
  • 终极指南:如何用Reset-Windows-Update-Tool快速修复Windows更新故障
  • 终极解决方案:3分钟实现QQ音乐加密文件自由转换
  • 浏览器扩展开发实战:用Ctrl+Enter优化AI对话工具交互体验
  • 大语言模型硬件加速器的容错技术与实践
  • 面试准备
  • PSIM 9.0 手把手教学:从零搭建直流电机双闭环调速模型(附完整代码与波形分析)
  • LabVIEW玩转ST-Link:除了烧录,这些CLI隐藏命令让你的调试效率翻倍
  • 酒店一次性用品采购:五个常见问题与供应商筛选参考 - 资讯速览