当前位置: 首页 > news >正文

AI应用关键词扫盲Function Calling MCP ReAct Skills RAG Harness

AI 学习日记:LLM、Agent 和上下文

最近学习了一些大模型和 Agent 相关的概念,简单记录一下自己的理解。

温度参数

温度可以理解为模型输出的随机程度。

当温度设置为 0 时,模型会尽量选择概率最高的词,输出更确定,适合写代码。

温度调高以后,模型会更愿意选择一些概率较低的词,输出会更有创意,但也更不可控。所以头脑风暴可以适当调高。

上下文窗口

大模型不是无限记忆的,它一次能看到的内容有限,这个范围叫 上下文窗口(Context Window)

如果对话太长,早期内容就可能被处理掉。常见做法是 压缩(Compaction),也就是把前面的对话总结成一段摘要,保留重要信息,丢掉细节。

所以比较好的使用方式是:一个 Session 尽量只处理一个主题。这样上下文更干净,模型也更不容易混乱。

Instruct 模型

我们平时用的大模型,大多不是单纯的 Base 模型,而是 Instruct 模型。

Instruct 模型是在 Base 模型基础上,用大量“指令-回答”数据做微调,再通过 RLHF 进一步优化,让模型更适合按照人的要求完成任务。

Function Calling

Function Calling 的核心是:模型不直接执行工具,而是输出一个结构化的工具调用请求。

外围程序拿到这个请求以后,真正去执行函数,然后把执行结果再放回上下文,让模型继续生成回答。

所以模型负责判断“要不要调用工具、调用哪个工具”,真正干活的是外部程序。

MCP

MCP 可以理解为给工具调用定了一套标准。

它标准化了工具怎么描述、参数怎么定义、怎么调用、结果怎么返回。

但 MCP 本身没有给模型增加新的 AI 能力,它底层还是 Tool Use 那套逻辑:把工具描述放进上下文,模型判断是否调用,程序执行工具,再把结果返回给模型。

它的价值主要在于标准化,让工具更容易复用和接入。

ReAct

ReAct 是 Reasoning + Acting。

简单来说,就是让模型在循环中不断执行:

思考 → 行动 → 观察结果 → 再思考

这也是 Agent 和普通聊天机器人的区别之一。Agent 不只是回答问题,还可以拆任务、调用工具、根据结果继续推进。

Skills

Skills 可以理解为可复用的工作流程。

比如总结论文这件事,可以固定成:提取标题、摘要、方法、实验结果、局限性、未来工作。以后遇到类似任务,就可以直接复用这套流程。

RAG

RAG 是让 Agent 用上外部知识。

模型本身不一定知道我们的私有资料,比如项目文档、论文、代码、公司知识库。所以需要先从外部知识库检索相关内容,再把这些内容放进上下文,让模型基于资料回答。

RAG 的重点不是让模型记住知识,而是让模型回答前先查资料。

Harness

为了让 LLM 写出来的代码能被验证,能尽早发现问题并修复,就需要一套测试、反馈、修复机制。这就是最近比较火的 Harness Engineering
如果说 RAG 是让 Agent 有知识,工具调用是让 Agent 有行动能力,那么 Harness 就是让 Agent 更可靠。
事前检测+事后反馈

总结

学到最后,我觉得有一句话很关键:

一切都是上下文。

http://www.jsqmd.com/news/1025032/

相关文章:

  • Codex:打工人专属的意图驱动型工作流引擎
  • 经济犯罪辩护律师事务所排行:四类案件辩护思路与选型指南 - 品牌2026
  • 深挖大连黄金回收行业乱象!5家口碑老店横向测评,教你精准估算到手金价 - 奢侈品回收评测
  • 深圳沛纳海、芝柏蒂芙尼名表回收行情解析,2026多平台实测收的顶性价比突出! - 奢侈品回收测评
  • Google Earth Pro 完全配置手册:从安装、GIS 数据导入到 KML 制作,一步到位
  • 2026免费图片去水印工具实测:哪款真正免费又好用?免费图片去水印工具推荐全攻略
  • 2026重庆包包回收五星测评榜单|收的顶满分五星断层领跑 - 奢侈品回收测评
  • 2026短视频文案提取全攻略:4种保姆级方法手把手教你
  • 构建专业招商展示系统:从战略内核到视觉呈现的完整指南
  • 2026 汕头特色火锅深度测评:本地人私藏 3 家好店,卤水火锅新标杆出圈 - 兔兔不是荼荼
  • 如何快速优化Windows 11:免费开源工具的终极秘籍
  • 实测复盘!2026 苏州名表回收榜单,口碑稳居前列 - 奢侈品交易观察员
  • AI辅助科研绘图实操指南:高效出图且合规的完整流程
  • MIAOYUN | 每周AI新鲜事儿 260612
  • 2026高考报考:东北大学工商管理学院王牌专业、热门就业专业及双学位介绍 - 品牌2026
  • 2026 东莞钻石回收机构排行|本地诚信龙头,估价公道半小时上门立估立结 - 奢侈品回收测评
  • 组件通信与注册
  • 2026年 非晶磁环厂家推荐榜单:快脉冲非晶磁环/核聚变非晶磁环/高精度磁环源头厂商深度测评 - 品牌发掘
  • 2026嘉兴黄金回收达人亲测:走访20店,整理出这份靠谱名单 - 商业信息快查
  • 2026年好用的视频去水印软件,视频去水印软件推荐合集
  • 去三亚点海鲜外卖怎样能点到便宜的?本地土著亲测省钱攻略快收好 - 资讯焦点
  • VisualCppRedist AIO:3分钟解决Windows软件运行问题的终极方案
  • 东北大学工商管理学院王牌专业有哪些?双学位项目就业前景详解 - 品牌2026
  • AI Agent 评估:怎么判断你的智能体到底好不好用?
  • 2026年展台搭建公司TOP10推荐:高级创意/简约稳固/大型小型展位展台设计搭建匠心精选,标杆品牌与靠谱服务深度解析! - 品牌发掘
  • java:变量与运算符
  • 候车厅人数统计管控智慧解决方案
  • 天津口碑雅思机构排行 2026:海归湾/环球雅思/新航道/朗阁/启德考培对比 - 资讯焦点
  • AI算法赋能烫金纸分切机:从机械裁切到智能决策的跨越
  • 2026年深圳合模机工厂排行:高精度、高效合模机源头厂家实力与口碑深度评测 - 品牌发掘