13个 AI Agent 的基础概念
1、Agent
Agent依靠大语言模型作为核心,同时拥有任务规划、信息记忆以及工具调用三大能力,能够自行拆分繁杂任务,反复执行操作,接收实时反馈并一步步推进流程直至任务收尾。
它跳出了单纯输出文字的局限,不再只会被动听从指令作答,能够像职场员工一样独立处理事务,完整走完整套工作流程。
2、大模型预训练
预训练就是利用海量的通用网络数据对模型开展基础训练,让模型熟练掌握语言使用逻辑、各类常识知识以及基础使用能力,搭建出可以重复使用的基础模型架构。
这种训练采用自监督学习模式,对于大语言模型而言,最主流的训练方式就是持续预判文本里接下来出现的词元内容。
3、大模型微调
微调操作是在已经训练完成的基础模型之上,使用体量更小、贴合实际应用场景的专属数据继续优化训练,让模型适配各类细分使用场景,日常大多采用监督式微调或者指令式微调两种训练方式。
4、大模型幻觉
大模型幻觉指的是模型输出的内容看着逻辑通顺,实际内容全部错误,模型会直接把编造的虚假内容当成真实信息进行回复,日常使用中不能默认大模型给出的所有回答都是准确无误的。
5、MCP协议
MCP也就是模型上下文协议,这套协议专门为各类AI应用打造统一的连接标准,方便AI对接各类外部数据资源与实用工具。
日常使用里,AI能够借助MCP接入本地文件、数据库、搜索引擎、计算工具以及各类专属提示词内容,调取对应信息完成实操工作,简单来讲,MCP就相当于AI设备通用的TypeC传输接口。
6、Token
Token中文称作词元,大模型无法直接识别文字内容,只能处理数字信息,分词器的作用就是把日常输入的文字内容转换成对应数字格式。
分词器会按照既定拆分规则切割文本生成一个个词元,再给每个词元匹配专属数字编号,后续大模型所有的运算推理工作,全都依靠这些数字编号完成。
7、RAG-检索增强生成
RAG全称检索增强生成,简单来说就是大模型作答之前先主动调取相关资料查阅,如同学生开卷答题一般。
即便模型本身没有学习过企业内部资料、专属行业内容,只要提前调取匹配的相关资料,模型就能结合调取到的真实内容,给出贴合需求、可信度更高的回答。
8、记忆模块
Agent搭载的记忆体系主要分为两个部分,第一部分是短期记忆,仅适用于当下对话场景,通过精简对话内容、整理对话摘要控制文本篇幅,同时保障对话内容逻辑通顺连贯。
第二部分是长期记忆,能够跨越不同对话场景调取内容,依靠向量匹配筛选出过往相关对话信息,按需融入当前对话内容当中。
9、Skill
Skill实际就是整理规整好的本地文件合集,用来补齐特定行业领域内的工作流程、专业知识以及实用操作工具,方便模型在对应场景里主动或是按需调用。
它属于针对大模型打造的能力整合形式,内部包含核心说明文档、工作规则流程、内容模板案例、实操脚本工具以及各类参考学习资料等内容。
10、ReAct
ReAct由逻辑思考和实际行动两部分组成,模型执行任务时会先梳理现有信息,判断现有内容能不能完成当下任务。
如果信息不足,就主动调用各类工具执行对应操作,拿到操作返回结果后,再继续梳理规划后续步骤,一步步推进直至整件事情处理完毕。
11、Agent的自我反思
Agent自我反思的核心逻辑就是先输出内容,再自行核对评估,结合评估出来的问题调整修正输出结果。
主要分为两种形式,第一种是自我复盘,依靠大模型自身核对输出内容,适合检查文案格式统一度、规则遵守情况以及内容是否出现随意改动;
第二种是外部核验,把生成内容放到实际工具中验证核对,适配代码编写、数值计算、格式文件制作这类需要贴合实际事实的工作。
12、Harness工程
Harness工程也叫作驾驭工程,是专门为AI Agent搭建适配工作环境的整套实用工程思路。
内容涵盖对话上下文统筹、工具调用管理、独立运行沙箱、使用权限划分、内容测试核验、运行日志记录、内容审核标准以及问题调整机制等,目的就是让AI Agent能够平稳融入实际工作系统,运行状态更稳定可控,顺利完成各类长期工作任务。
13、SDD-规格驱动开发
SDD也就是规格驱动开发,这套工作模式要求正式着手编写代码之前,先用规范文档确定好需求调整目标、工作覆盖范围、系统运行模式、设计限制条件以及各项任务拆分细节。
后续让AI严格依照敲定好的规范文档开展开发工作,把模糊笼统的需求梳理成清晰稳定的工作依据,有效避免AI自行揣测需求、随意改动原有逻辑以及开发方向出现偏差这类问题。
