当前位置: 首页 > news >正文

13个 AI Agent 的基础概念

1、Agent

Agent依靠大语言模型作为核心,同时拥有任务规划、信息记忆以及工具调用三大能力,能够自行拆分繁杂任务,反复执行操作,接收实时反馈并一步步推进流程直至任务收尾。

它跳出了单纯输出文字的局限,不再只会被动听从指令作答,能够像职场员工一样独立处理事务,完整走完整套工作流程。

2、大模型预训练

预训练就是利用海量的通用网络数据对模型开展基础训练,让模型熟练掌握语言使用逻辑、各类常识知识以及基础使用能力,搭建出可以重复使用的基础模型架构。

这种训练采用自监督学习模式,对于大语言模型而言,最主流的训练方式就是持续预判文本里接下来出现的词元内容。

3、大模型微调

微调操作是在已经训练完成的基础模型之上,使用体量更小、贴合实际应用场景的专属数据继续优化训练,让模型适配各类细分使用场景,日常大多采用监督式微调或者指令式微调两种训练方式。

4、大模型幻觉

大模型幻觉指的是模型输出的内容看着逻辑通顺,实际内容全部错误,模型会直接把编造的虚假内容当成真实信息进行回复,日常使用中不能默认大模型给出的所有回答都是准确无误的。

5、MCP协议

MCP也就是模型上下文协议,这套协议专门为各类AI应用打造统一的连接标准,方便AI对接各类外部数据资源与实用工具。

日常使用里,AI能够借助MCP接入本地文件、数据库、搜索引擎、计算工具以及各类专属提示词内容,调取对应信息完成实操工作,简单来讲,MCP就相当于AI设备通用的TypeC传输接口。

6、Token

Token中文称作词元,大模型无法直接识别文字内容,只能处理数字信息,分词器的作用就是把日常输入的文字内容转换成对应数字格式。

分词器会按照既定拆分规则切割文本生成一个个词元,再给每个词元匹配专属数字编号,后续大模型所有的运算推理工作,全都依靠这些数字编号完成。

7、RAG-检索增强生成

RAG全称检索增强生成,简单来说就是大模型作答之前先主动调取相关资料查阅,如同学生开卷答题一般。

即便模型本身没有学习过企业内部资料、专属行业内容,只要提前调取匹配的相关资料,模型就能结合调取到的真实内容,给出贴合需求、可信度更高的回答。

8、记忆模块

Agent搭载的记忆体系主要分为两个部分,第一部分是短期记忆,仅适用于当下对话场景,通过精简对话内容、整理对话摘要控制文本篇幅,同时保障对话内容逻辑通顺连贯。

第二部分是长期记忆,能够跨越不同对话场景调取内容,依靠向量匹配筛选出过往相关对话信息,按需融入当前对话内容当中。

9、Skill

Skill实际就是整理规整好的本地文件合集,用来补齐特定行业领域内的工作流程、专业知识以及实用操作工具,方便模型在对应场景里主动或是按需调用。

它属于针对大模型打造的能力整合形式,内部包含核心说明文档、工作规则流程、内容模板案例、实操脚本工具以及各类参考学习资料等内容。

10、ReAct

ReAct由逻辑思考和实际行动两部分组成,模型执行任务时会先梳理现有信息,判断现有内容能不能完成当下任务。

如果信息不足,就主动调用各类工具执行对应操作,拿到操作返回结果后,再继续梳理规划后续步骤,一步步推进直至整件事情处理完毕。

11、Agent的自我反思

Agent自我反思的核心逻辑就是先输出内容,再自行核对评估,结合评估出来的问题调整修正输出结果。

主要分为两种形式,第一种是自我复盘,依靠大模型自身核对输出内容,适合检查文案格式统一度、规则遵守情况以及内容是否出现随意改动;

第二种是外部核验,把生成内容放到实际工具中验证核对,适配代码编写、数值计算、格式文件制作这类需要贴合实际事实的工作。

12、Harness工程

Harness工程也叫作驾驭工程,是专门为AI Agent搭建适配工作环境的整套实用工程思路。

内容涵盖对话上下文统筹、工具调用管理、独立运行沙箱、使用权限划分、内容测试核验、运行日志记录、内容审核标准以及问题调整机制等,目的就是让AI Agent能够平稳融入实际工作系统,运行状态更稳定可控,顺利完成各类长期工作任务。

13、SDD-规格驱动开发

SDD也就是规格驱动开发,这套工作模式要求正式着手编写代码之前,先用规范文档确定好需求调整目标、工作覆盖范围、系统运行模式、设计限制条件以及各项任务拆分细节。

后续让AI严格依照敲定好的规范文档开展开发工作,把模糊笼统的需求梳理成清晰稳定的工作依据,有效避免AI自行揣测需求、随意改动原有逻辑以及开发方向出现偏差这类问题。

http://www.jsqmd.com/news/859887/

相关文章:

  • 数据库崩了别只会上香:死锁日志里藏着的4条“凶手线索”
  • OpenRPA完全指南:免费开源的企业级RPA自动化终极方案
  • CPT Markets:客户体验持续优化的系统思维
  • 介绍 NGINX 中的 Agentic Observability:实时 MCP 流量监测
  • Taotoken的TokenPlan套餐如何让我的开发成本更可控
  • 以 AIGC 贯通设计 — 生产 — 营销:集之互动推动服装电商供应链进入全域协同新阶段
  • 618+毕业季:学生游戏本怎么选?天选6 Pro等4款一线全推荐
  • LDDC:免费歌词工具终极指南 - 如何快速获取精准卡拉OK歌词
  • 四川高考 470-530 分之间,报考重庆哪所高校好?(2026 靠谱学校推荐) - 品牌2025
  • 终极解决方案:在Chrome浏览器中实现密码无缝同步
  • 2026年腾讯云OpenClaw/Hermes Agent配置Token Plan全步骤操作指南
  • Cosy通过USB连接PLC时如何排查USB over IP故障
  • [特殊字符] 视觉Transformer (ViT) 原理及性能突破:从CNN到大规模自注意力机制的迁移
  • 2026年6月PMP最后14天自救指南:说实话,现在不是你放弃的时候
  • 2026年Q2中国化粪池清理服务优质企业首选推荐:合肥玉通管道工程有限公司安徽砼威建材有限公司 - 安互工业信息
  • 【抽奖系统-0】Redis 缓存与 RabbitMQ 削峰实战;架构梳理
  • 随机数Random
  • 当行李箱开始追着你跑:我拆解了自动跟随技术为什么在2026年突然爆发
  • OpenClaw集群有哪些应用场景?
  • 美联储加息降息,如何牵动美黄金价格?
  • 工业视频应用进入“超高速时代”:100Gbps背后意味着什么?
  • SGLang 与 vLLM 对比评测:谁更适合你的生产环境?
  • 2026年AI写作辅助平台盘点:12款神器助你高效完成文献搜集、创作和修稿
  • 饮品防窜货系统:数字化管控,筑牢渠道秩序防线 附联系方式 - 易全一物一码提供商
  • CS/β-GP/nmTiO2温敏声敏双控可注射水凝胶的相变行为
  • ElevenLabs四川话语音落地避坑清单:97%开发者忽略的3个方言声学参数校准关键点
  • C# DateTime操作全解析
  • 2026年4月口碑好的彩钢墙板源头工厂口碑推荐,铝制地板/PVC防静电地板/硫酸钙地板/静电地板,彩钢墙板门店找哪家 - 品牌推荐师
  • MySQL 8.0 vs 国产数据库 vs PostgreSQL:索引特性全面对比
  • Unity UI适配方案