AI Agent 12 项底层核心原理 + 应用方法
1. messages 对话数组
底层原理
大模型无独立数据库存储对话,所有交互依托标准messages数组传输。数组内每条元素标记角色(system/user/assistant)+ 对应文本,模型仅解析该数组内容生成回复;数组为空时,无输入上下文,模型不会输出内容。
应用方法
- 格式规范:遵循通用结构,区分角色位
json
[ {"role":"system","content":"人设/规则"}, {"role":"user","content":"用户提问"}, {"role":"assistant","content":"AI历史回复"} ] - 实操规则:每一轮对话都追加新消息到数组尾部;多轮对话完整保留历史消息。
典型场景
所有对话类应用、Agent 会话、接口调用;避坑:数组乱序、角色标注错误会导致语义理解错乱。
2. 上下文窗口(Context Window)
底层原理
模型单次推理有固定字符 / Token 上限,不存在持久记忆。实现 “记忆” 的唯一方式:把完整历史对话 + 当前问题全部拼接进 messages 数组,一次性投喂给模型。超出窗口上限会自动截断内容,造成记忆丢失。
应用方法
- 基础用法:短对话直接全量传递历史消息;
- 进阶优化(长会话):
- 滑动窗口:只保留最近 N 轮对话;
- 摘要压缩:用模型把老旧对话浓缩为简短摘要,减少 Token 占用;
- 选型参考:小模型窗口小,长链路 Agent 优先选用
