当前位置：首页 > news >正文

LangChain 实战：大模型对话记忆模块（附完整代码 + Web 案例）

news 2026/3/26 15:34:04

前言：为什么需要对话记忆？

一、核心认知：原始 API vs LangChain 封装

1.1 原生 API 调用的痛点（无记忆）

1.2 LangChain 的价值：封装记忆与简化调用

二、LangChain 记忆模块核心组件

2.1 基础款：ConversationBufferMemory（完整记忆）

2.2 进阶款：窗口记忆与总结记忆

（1）ConversationBufferWindowMemory（窗口记忆）

（2）ConversationSummaryMemory（总结记忆）

三、实战 1：LangChain 记忆链（ConversationChain）

四、实战 2：Streamlit 搭建带记忆的聊天 Web 应用

4.1 项目结构

4.2 后端逻辑（scripts.py）

4.3 前端逻辑（app.py）

4.4 运行应用

五、学习总结 & 避坑指南

5.1 核心知识点总结

5.2 避坑指南

最后

前言：为什么需要对话记忆？

日常使用豆包、ChatGPT 等 AI 应用时，我们习以为常的「上下文记忆」功能（比如问完 “林俊杰是谁” 再问 “他的代表作”，AI 能精准理解），其实并非大模型原生自带 —— 直接调用大模型 API 时，每次请求都是独立的，模型只会基于当前输入的 Token 逐个预测回复，完全没有 “记忆” 能力，返回的也是包含原始格式的完整响应。

LangChain 作为大模型应用开发的核心框架，已经帮我们封装了对话记忆、Prompt 模板、链式调用等高频功能，无需手动解析原始 API 的复杂输出，也不用自己拼接上下文。

一、核心认知：原始 API vs LangChain 封装

1.1 原生 API 调用的痛点（无记忆）

直接调用大模型 API（即使是通义千问等兼容 OpenAI 接口的模型），每次请求都是 “一次性” 的，模型无法关联历史对话：

from openai import OpenAI import os # 初始化客户端（对接阿里云通义千问） client = OpenAI( api_key=os.getenv("DASHSCOPE_API_KEY"), base_url="https://dashscope.aliyuncs.com/compatible-mode/v1", ) # 第一次提问：林俊杰是谁 completion1 = client.chat.completions.create( model="qwen3.5-plus", messages=[{"role":"user","content":"林俊杰是谁？"}] ) print("第一轮回复：", completion1.choices[0].message.content) # 第二次提问：他有哪些代表作（无上下文，模型无法识别"他"） completion2 = client.chat.completions.create( model="qwen3.5-plus", messages=[{"role":"user","content":"他有哪些代表作？"}] ) print("第二轮回复：", completion2.choices[0].message.content)

输出结果：第二轮回复会反问 “你说的他是谁？”，因为模型没有历史对话的记忆。

1.2 LangChain 的价值：封装记忆与简化调用

LangChain 的核心价值在于：

封装对话记忆模块，无需手动拼接上下文；
统一不同大模型的调用方式（OpenAI / 通义千问 / 讯飞等）；
提供链式调用能力，串联 “记忆→Prompt→模型→输出” 全流程；
自动处理响应格式，直接返回可读的回复内容。

二、LangChain 记忆模块核心组件

LangChain 提供了多种记忆类型，适配不同场景，核心均基于ConversationBufferMemory扩展：

记忆类型	核心逻辑	适用场景
`ConversationBufferMemory`	保存所有对话历史，无长度限制	短对话、需要完整上下文的场景
`ConversationBufferWindowMemory`	只保存最近`k`轮对话	只需要短期记忆、节省 Token 的场景
`ConversationSummaryMemory`	将对话历史总结成文本	长对话、需要压缩上下文的场景
`ConversationSummaryBufferMemory`	短对话保留原文，超长部分总结	兼顾细节和长度的长对话场景
`ConversationTokenBufferMemory`	按 Token 数限制对话长度	严格控制上下文 Token 消耗的场景

2.1 基础款：ConversationBufferMemory（完整记忆）

最核心的记忆组件，保存所有对话历史，是其他记忆类型的基础：

from langchain.memory import ConversationBufferMemory # 初始化记忆（return_messages=True：以消息对象存储，更易复用） memory = ConversationBufferMemory(return_messages=True) # 保存第一轮对话 memory.save_context({"input": "我的名字是陆天宇"}, {"output": "你好，陆天宇！"}) # 保存第二轮对话 memory.save_context({"input": "我是AI开发者"}, {"output": "太酷了！我们是同行～"}) # 加载记忆（查看历史对话） print("记忆中的历史对话：") print(memory.load_memory_variables({}))

输出结果：

记忆中的历史对话： {'history': [HumanMessage(content='我的名字是陆天宇'), AIMessage(content='你好，陆天宇！'), HumanMessage(content='我是AI开发者'), AIMessage(content='太酷了！我们是同行～')]}