人类记忆分类与 LLM 的核心映射
将人类的认知记忆分类(语义记忆、情景记忆、程序性知识)与大语言模型(LLM)的架构和工程技术进行映射,是一个极其精妙且深刻的类比。
在认知心理学中,这些记忆组成了人类的整个智能系统;而在现代大模型工程(尤其是在 2026 年的 Agent 和 RAG 架构共识)中,它们分别对应着 LLM 的不同技术组件和数据流动方式。
我们可以通过下面这个多维度的映射矩阵,来看透 AI 是如何模拟人类记忆系统的:
🗺️ 人类记忆分类与 LLM 的核心映射
+-------------------------------------------------------+ | 大语言模型记忆系统 | +-------------------------------------------------------+ | | [语义记忆 Semantic] [情景记忆 Episodic] [程序记忆 Procedural] • 预训练参数模型 • 向量数据库 (RAG) • 指令/对齐微调 (SFT/RLHF) • 通用事实与常识 • 短期/长期对话上下文 • Agent 工具调用与 Prompt 流程 | | +-------------------------------------------------------+1. 语义记忆 (Semantic Memory) $\rightarrow$ LLM 的预训练参数 (Pre-trained Parameters)
人类的语义记忆:指我们对外部世界的通用事实、常识、概念和语言规则的记忆。它脱离了特定的时间、地点和个人经历(例如:知道“巴黎是法国的首都”、“水的分子式是 $H_2O$”,但你不需要记住你是哪年哪月在哪学会这个知识的)。
LLM 的对应组件:预训练阶段被编码进模型全局权重(Weights)的隐式知识库。
工程表现:大模型在海量语料上做“下一词预测”后,数以亿计的参数矩阵自发形成的关于这个世界的条件概率分布。当你直接问 AI 一个常识性问题,它不需要查阅任何外部文档就能直接脱口而出,这就是在提取它的“语义记忆”。
2. 情景记忆 (Episodic Memory) $\rightarrow$ 动态上下文 (Context Window) 与 向量数据库 (RAG)
人类的情景记忆:指关于个人经历、特定事件、时间、地点以及当时场景的记忆(例如:记住“你昨天早餐吃了什么”、“上个礼拜跟某位客户开会聊了哪些具体细节”)。它是高度有时效性、空间性和动态更新的。
LLM 的对应组件:长文本上下文窗口(Context Window)以及外挂的检索增强生成(RAG/Vector DB)。
工程表现:
短期情景记忆:存在于当前的 Prompt 会话中。AI 能记住你在前五轮对话里说过的私房话、传给它的具体报错截图,这些信息随着会话结束而清空。
长期情景记忆:当 Agent 智能体将过去的聊天记录、用户的个人偏好快照、或者企业的实时交易日志(Log)切片存储到向量数据库中。在推理时,通过 Embedding 相似度检索,把这些“特定经历”重新塞进 Context 里提供给模型。
3. 程序性记忆 (Procedural Memory) $\rightarrow$ 微调 (SFT/DPO) 与 Agent 工作流 (Workflows)
人类的程序性记忆:关于如何做某事的方法、步骤和技能的记忆,通常是自动化的“肌肉记忆”,难以用语言精确描述,但一旦学会就高度固化(例如:骑自行车、弹钢琴、打字、写代码的直觉)。
LLM 的对应组件:监督微调(SFT)、强化学习(RLHF/RLAIF)、人类意图对齐、以及 Agent 内部的 Tools 调用链。
工程表现:
这正是你前面提到的“将任务模式编码到参数中”。通过微调,大模型学到的不是某个具体的事实(语义记忆),而是学到了“行为范式”。
比如:让模型学习“如何进行思维链(CoT)推理”、“如何把一段自然语言精准转化为标准的 JSON 格式输出”、或者“在什么情况下应该去调用 MCP 服务器上的 GitHub 工具”。这种按照既定逻辑去执行任务的底层模式,就是 AI 的程序性记忆。
📊 深度对比透视图
为了更直观地看清它们在工程落地时的生命周期与更新成本,我们可以将其梳理成一张技术对比表:
| 记忆类型 | 人类认知表现 | LLM 工程落地技术 | 信息存储位置 | 写入/更新成本 | 核心风险与痛点 |
Semantic (语义记忆) | 世界常识、词汇定义、客观规律。 | 基座预训练参数 (Base Model Weights) | 散落于全连接层(FFN)和注意力矩阵中。 | 极高 (需要极其昂贵的算力进行重新训练)。 | 灾难性遗忘、知识滞后、事实性幻觉。 |
Episodic (情景记忆) | 个人经历、特定时间地点的事件细节。 | Context Window + 向量数据库 (RAG) | 内存/显存(动态)、外部外部数据库(静态)。 | 极低 (毫秒级,直接写入数据库或拼接 Context)。 | 召回准确率限制、上下文窗口长度天花板。 |
Procedural (程序记忆) | 技能、流程、干活的“肌肉记忆”。 | 指令微调 (SFT) + Agent 提示词骨架 | 对齐后的参数权重、代码硬编码的流程图。 | 中等 (需要高质量任务数据集与微调算力)。 | 过拟合(泛化能力丧失)、对未知任务束手无措。 |
💡 2026 年认知架构师(Cognitive Architect)的思考
在当前的智能体(Agent)系统设计中,真正的技术高手不会强求某一个组件包揽所有的记忆功能:
当你尝试去开发一个自动帮你分析金融行情并发送周报的 Agent 时,你的架构设计其实是在完美复刻人类的这三套记忆神经系统:
你会挑选一个“语义记忆”极度发达的商业或开源大模型(如
openai/gpt-oss-120b)作为大脑,确保它懂基本的金融术语。你会编写一套严格的 Prompt 模版或通过微调固化它的“程序记忆”,训练它只要看到数据,就必须严格按照(分析 $\rightarrow$ 评估 $\rightarrow$ 总结)的步骤执行工具调用(Tool Use)。
每次运行时,你会通过 RAG 把最新的市场研报和该用户往期的投资历史(“情景记忆”)动态注入进去,确保它不会张冠李戴。
这三种记忆的有机结合,才让今天的 LLM 真正从一个简单的“文本生成器”跃升为了具有人类思维框架的“数字智能体”。
