当前位置：首页 > news >正文

人类记忆分类与 LLM 的核心映射

news 2026/6/23 9:01:43

将人类的认知记忆分类（语义记忆、情景记忆、程序性知识）与大语言模型（LLM）的架构和工程技术进行映射，是一个极其精妙且深刻的类比。

在认知心理学中，这些记忆组成了人类的整个智能系统；而在现代大模型工程（尤其是在 2026 年的 Agent 和 RAG 架构共识）中，它们分别对应着 LLM 的不同技术组件和数据流动方式。

我们可以通过下面这个多维度的映射矩阵，来看透 AI 是如何模拟人类记忆系统的：

🗺️ 人类记忆分类与 LLM 的核心映射

+-------------------------------------------------------+ | 大语言模型记忆系统 | +-------------------------------------------------------+ | | [语义记忆 Semantic] [情景记忆 Episodic] [程序记忆 Procedural] • 预训练参数模型 • 向量数据库 (RAG) • 指令/对齐微调 (SFT/RLHF) • 通用事实与常识 • 短期/长期对话上下文 • Agent 工具调用与 Prompt 流程 | | +-------------------------------------------------------+

1. 语义记忆 (Semantic Memory) $\rightarrow$ LLM 的预训练参数 (Pre-trained Parameters)

人类的语义记忆：指我们对外部世界的通用事实、常识、概念和语言规则的记忆。它脱离了特定的时间、地点和个人经历（例如：知道“巴黎是法国的首都”、“水的分子式是 $H_2O$”，但你不需要记住你是哪年哪月在哪学会这个知识的）。
LLM 的对应组件：预训练阶段被编码进模型全局权重（Weights）的隐式知识库。
工程表现：大模型在海量语料上做“下一词预测”后，数以亿计的参数矩阵自发形成的关于这个世界的条件概率分布。当你直接问 AI 一个常识性问题，它不需要查阅任何外部文档就能直接脱口而出，这就是在提取它的“语义记忆”。

2. 情景记忆 (Episodic Memory) $\rightarrow$ 动态上下文 (Context Window) 与向量数据库 (RAG)

人类的情景记忆：指关于个人经历、特定事件、时间、地点以及当时场景的记忆（例如：记住“你昨天早餐吃了什么”、“上个礼拜跟某位客户开会聊了哪些具体细节”）。它是高度有时效性、空间性和动态更新的。
LLM 的对应组件：长文本上下文窗口（Context Window）以及外挂的检索增强生成（RAG/Vector DB）。
工程表现：
- 短期情景记忆：存在于当前的 Prompt 会话中。AI 能记住你在前五轮对话里说过的私房话、传给它的具体报错截图，这些信息随着会话结束而清空。
- 长期情景记忆：当 Agent 智能体将过去的聊天记录、用户的个人偏好快照、或者企业的实时交易日志（Log）切片存储到向量数据库中。在推理时，通过 Embedding 相似度检索，把这些“特定经历”重新塞进 Context 里提供给模型。

3. 程序性记忆 (Procedural Memory) $\rightarrow$ 微调 (SFT/DPO) 与 Agent 工作流 (Workflows)

人类的程序性记忆：关于如何做某事的方法、步骤和技能的记忆，通常是自动化的“肌肉记忆”，难以用语言精确描述，但一旦学会就高度固化（例如：骑自行车、弹钢琴、打字、写代码的直觉）。
LLM 的对应组件：监督微调（SFT）、强化学习（RLHF/RLAIF）、人类意图对齐、以及 Agent 内部的 Tools 调用链。
工程表现：
- 这正是你前面提到的“将任务模式编码到参数中”。通过微调，大模型学到的不是某个具体的事实（语义记忆），而是学到了“行为范式”。
- 比如：让模型学习“如何进行思维链（CoT）推理”、“如何把一段自然语言精准转化为标准的 JSON 格式输出”、或者“在什么情况下应该去调用 MCP 服务器上的 GitHub 工具”。这种按照既定逻辑去执行任务的底层模式，就是 AI 的程序性记忆。

📊 深度对比透视图

为了更直观地看清它们在工程落地时的生命周期与更新成本，我们可以将其梳理成一张技术对比表：

记忆类型	人类认知表现	LLM 工程落地技术	信息存储位置	写入/更新成本	核心风险与痛点
Semantic (语义记忆)	世界常识、词汇定义、客观规律。	基座预训练参数 (Base Model Weights)	散落于全连接层（FFN）和注意力矩阵中。	极高 (需要极其昂贵的算力进行重新训练)。	灾难性遗忘、知识滞后、事实性幻觉。
Episodic (情景记忆)	个人经历、特定时间地点的事件细节。	Context Window + 向量数据库 (RAG)	内存/显存（动态）、外部外部数据库（静态）。	极低 (毫秒级，直接写入数据库或拼接 Context)。	召回准确率限制、上下文窗口长度天花板。
Procedural (程序记忆)	技能、流程、干活的“肌肉记忆”。	指令微调 (SFT) + Agent 提示词骨架	对齐后的参数权重、代码硬编码的流程图。	中等 (需要高质量任务数据集与微调算力)。	过拟合（泛化能力丧失）、对未知任务束手无措。

💡 2026 年认知架构师（Cognitive Architect）的思考

在当前的智能体（Agent）系统设计中，真正的技术高手不会强求某一个组件包揽所有的记忆功能：

当你尝试去开发一个自动帮你分析金融行情并发送周报的 Agent 时，你的架构设计其实是在完美复刻人类的这三套记忆神经系统：

你会挑选一个“语义记忆”极度发达的商业或开源大模型（如openai/gpt-oss-120b）作为大脑，确保它懂基本的金融术语。
你会编写一套严格的 Prompt 模版或通过微调固化它的“程序记忆”，训练它只要看到数据，就必须严格按照（分析 $\rightarrow$ 评估 $\rightarrow$ 总结）的步骤执行工具调用（Tool Use）。
每次运行时，你会通过 RAG 把最新的市场研报和该用户往期的投资历史（“情景记忆”）动态注入进去，确保它不会张冠李戴。

这三种记忆的有机结合，才让今天的 LLM 真正从一个简单的“文本生成器”跃升为了具有人类思维框架的“数字智能体”。

查看全文

http://www.jsqmd.com/news/1066461/