当前位置：首页 > news >正文

LangChain 从入门到实战：大模型应用开发全流程教程

news 2026/7/14 12:25:06

前言

一、LangChain 核心介绍

1.1 什么是 LangChain？

1.2 为什么必须学 LangChain？

1.3 本文学习路线（循序渐进）

二、环境搭建（从零开始）

2.1 安装 Python 与依赖

2.2 本地大模型准备（Ollama）

三、LangChain 基础：最简单的 LLM 调用

3.1 一行代码调用本地大模型

3.2 关键参数说明

四、LangChain 核心组件精讲（必学）

4.1 提示词模板（PromptTemplate）

4.2 链（Chain）：组件流水线

4.3 对话记忆（Memory）

4.4 文档加载器（Loader）

4.5 文本分割器（TextSplitter）

4.6 向量数据库与嵌入（Embedding）

五、实战项目 1：基础智能问答系统

六、实战项目 2：RAG 文档知识库问答（企业最常用）

6.1 完整代码（可直接运行）

七、实战项目 3：大模型工具调用（计算器、搜索）

八、实战项目 4：流式输出（打字机效果）

九、LangChain 项目开发完整流程（企业标准）

十、常见报错与解决方案

1. Ollama 连接失败

2. 向量库加载失败

3. 回答不准确

4. 文档读取失败

十一、总结

前言

大模型时代，LLM 应用开发已经成为程序员必备技能。但直接调用大模型 API 只能实现简单问答，无法满足文档问答、多轮记忆、工具调用、结构化输出、知识库检索等企业级需求。

LangChain正是解决这一问题的最强框架 —— 它统一了全球主流大模型的调用接口，提供提示词模板、文档加载、文本分割、向量检索、智能代理、工具调用等一站式能力，让开发者用几十行 Python 代码，快速搭建商用级 AI 应用。

本文是2025 年最新 LangChain 全流程教程，从环境安装、基础组件、核心模块，到RAG 知识库、工具调用、多轮对话、流式输出四大实战项目，全程可直接运行代码，零基础也能快速掌握大模型应用开发。

一、LangChain 核心介绍

1.1 什么是 LangChain？

LangChain 是一个开源大模型应用开发框架，用于快速构建基于 LLM 的复杂应用。它的核心价值：

统一大模型接口（通义千问、Llama3、DeepSeek、GPT 等一套代码通用）
提供模块化组件（提示词、记忆、检索、代理、工具）
快速实现 RAG、AI 客服、代码助手、数据分析等应用

1.2 为什么必须学 LangChain？

开发效率提升 10 倍，无需重复造轮子
屏蔽底层差异，切换模型只改一行配置
企业落地必备，90% 大模型项目基于 LangChain 构建
生态最成熟，文档、插件、社区资源最全

1.3 本文学习路线（循序渐进）

环境搭建 + 基础调用
核心组件精讲（提示词、记忆、文档、向量库、链）
四大实战项目（问答、RAG、工具、流式对话）
项目封装 + 部署思路

二、环境搭建（从零开始）

2.1 安装 Python 与依赖

bash

运行

# 核心框架 pip install langchain langchain-community langchain-ollama # 向量数据库 pip install chromadb # 文档处理 pip install pypdf python-docx sentence-transformers # 工具库 pip install tqdm requests

2.2 本地大模型准备（Ollama）

本文使用本地离线大模型，安全无费用：

安装 Ollama：https://ollama.com/
拉取模型：

bash

运行

ollama run llama3 # 或中文模型 ollama run qwen:7b

确认服务启动：http://127.0.0.1:11434

三、LangChain 基础：最简单的 LLM 调用

3.1 一行代码调用本地大模型

python

运行

# 01_basic_llm.py from langchain_ollama import OllamaLLM # 初始化模型 llm = OllamaLLM(model="llama3") # 调用 response = llm.invoke("请介绍一下LangChain框架") print(response)

运行成功 = 环境搭建完成！

3.2 关键参数说明

python

运行

llm = OllamaLLM( model="llama3", # 模型名称 temperature=0.1, # 随机性（0=精准，1=创意） max_tokens=2048, # 最大生成长度 top_p=0.9 # 核采样 )

四、LangChain 核心组件精讲（必学）

4.1 提示词模板（PromptTemplate）

解决：固定格式提问、批量生成、结构化输出

python

运行

from langchain.prompts import PromptTemplate # 定义模板 prompt = PromptTemplate( input_variables=["topic"], template="请详细解释技术概念：{topic}" ) # 拼接 final_prompt = prompt.format(topic="RAG检索增强生成") print(final_prompt)

4.2 链（Chain）：组件流水线

python

运行

# 最简单的链：提示词 + LLM chain = prompt | llm result = chain.invoke({"topic": "大模型微调"}) print(result)

|符号 = LangChain 最核心的管道语法

4.3 对话记忆（Memory）

实现多轮对话，保留上下文：

python

运行

from langchain.memory import ConversationBufferMemory from langchain.chains import ConversationChain # 记忆组件 memory = ConversationBufferMemory() chain = ConversationChain(llm=llm, memory=memory) # 第一轮 print(chain.predict(input="你好，我叫小明")) # 第二轮 print(chain.predict(input="我叫什么名字？"))

4.4 文档加载器（Loader）

支持 PDF / Word / TXT / Markdown：

python

运行

from langchain_community.document_loaders import TextLoader loader = TextLoader("test.txt") docs = loader.load() print(docs)

4.5 文本分割器（TextSplitter）

长文档切片，适配大模型上下文：

python

运行

from langchain.text_splitter import RecursiveCharacterTextSplitter splitter = RecursiveCharacterTextSplitter( chunk_size=500, # 每片长度 chunk_overlap=100 # 重叠长度 ) split_docs = splitter.split_documents(docs)

4.6 向量数据库与嵌入（Embedding）

将文本转为向量，用于语义检索：

python

运行

from langchain_community.embeddings import SentenceTransformerEmbeddings from langchain_community.vectorstores import Chroma embedding = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2") db = Chroma.from_documents(split_docs, embedding) # 相似度检索 retriever = db.as_retriever(search_kwargs={"k":3}) result = retriever.invoke("LangChain是什么") print(result)

五、实战项目 1：基础智能问答系统

python

运行

# 02_chat_bot.py from langchain_ollama import OllamaLLM from langchain.prompts import ChatPromptTemplate from langchain.chains import LLMChain # 1. 模型 llm = OllamaLLM(model="llama3", temperature=0.3) # 2. 提示词 prompt = ChatPromptTemplate.from_messages([ ("system", "你是专业AI助手，回答简洁清晰"), ("user", "{question}") ]) # 3. 构建链 chain = prompt | llm # 4. 对话 while True: q = input("你：") if q in ["exit", "退出"]: break print("AI：", chain.invoke({"question": q}))

六、实战项目 2：RAG 文档知识库问答（企业最常用）

6.1 完整代码（可直接运行）

python

运行

# 03_rag_qa.py from langchain_ollama import OllamaLLM from langchain.prompts import PromptTemplate from langchain_community.document_loaders import TextLoader from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain_community.embeddings import SentenceTransformerEmbeddings from langchain_community.vectorstores import Chroma from langchain.chains import RetrievalQA # 1. 加载文档 loader = TextLoader("knowledge.txt") docs = loader.load() # 2. 切片 splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=100) split_docs = splitter.split_documents(docs) # 3. 向量库 embedding = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2") db = Chroma.from_documents(split_docs, embedding) retriever = db.as_retriever(search_kwargs={"k":3}) # 4. 模型 llm = OllamaLLM(model="llama3", temperature=0.1) # 5. 提示词 prompt = PromptTemplate( template="""根据参考内容回答问题： 参考：{context} 问题：{question}""", input_variables=["context", "question"] ) # 6. RAG 链 rag_chain = RetrievalQA.from_chain_type( llm=llm, chain_type="stuff", retriever=retriever, chain_type_kwargs={"prompt": prompt} ) # 7. 测试 question = "你的知识库内容是什么？" print(rag_chain.invoke(question))

七、实战项目 3：大模型工具调用（计算器、搜索）

python

运行

# 04_tool_call.py from langchain_ollama import OllamaLLM from langchain.tools import tool from langchain.agents import create_react_agent, AgentExecutor from langchain.prompts import PromptTemplate # 1. 自定义工具：计算器 @tool def calculator(expression: str) -> str: """输入数学表达式，返回计算结果""" return str(eval(expression)) # 2. 模型 llm = OllamaLLM(model="llama3") # 3. 提示词 prompt = PromptTemplate.from_template(""" 你是智能助手，可以使用工具。 可用工具：{tools} 问题：{input} """) # 4. 智能代理 agent = create_react_agent(llm, [calculator], prompt) executor = AgentExecutor(agent=agent, tools=[calculator], verbose=True) # 5. 调用 print(executor.invoke({"input": "35 * 24 + 120 = ?"}))

八、实战项目 4：流式输出（打字机效果）

python

运行

# 05_stream_chat.py from langchain_ollama import OllamaLLM llm = OllamaLLM(model="llama3") # 流式输出 for chunk in llm.stream("写一段关于AI的短文案"): print(chunk, end="", flush=True)