当前位置：首页 > news >正文

LangChain RAG + FastAPI 接口化 + Docker 容器化

news 2026/5/4 19:49:55

把 RAG 系统封装成RESTful API（可被前端 / 小程序 / App 调用）
给 API 加文档、异常处理、日志、配置化
把整套服务Docker 容器化，一键部署、到处运行
接口支持：上传 PDF、构建知识库、提问、清空知识库

先讲核心新知识（必须掌握）

1. FastAPI 是什么？

高性能 Python Web 框架，用来把你的 AI 服务变成 API 接口：

自动生成 API 文档（/docs）
支持异步、高并发
类型提示、自动校验参数
适合做 AI 后端服务

2. Docker 是什么？

容器化工具，把你的代码 + 环境 + 依赖打包成一个镜像：

解决「在我电脑能跑，你那不能跑」问题
一键部署到服务器 / 云平台
隔离环境，稳定不冲突

3. 我们要做的架构

用户/前端 → FastAPI接口 → RAG系统 → Chroma向量库 → 返回回答

🚀 第一步：项目结构（标准工程化）

plaintext

rag_api_project/ ├── .env # 配置文件 ├── main.py # FastAPI 主程序 ├── requirements.txt # 依赖 ├── Dockerfile # 构建镜像 ├── .dockerignore # Docker 忽略文件 └── uploads/ # 上传PDF目录 └── chroma_db/ # 向量库（自动生成）

📦 第二步：完整代码（功能极强、稳定、可直接部署）

1.`requirements.txt`

fastapi uvicorn[standard] python-multipart python-dotenv langchain langchain-openai langchain-community pypdf chromadb

2.`.env`

DOUBAO_API_KEY=你的豆包key CHROMA_DB_DIR=./chroma_db UPLOAD_DIR=./uploads HOST=0.0.0.0 PORT=8000

3.`main.py`（核心：FastAPI + RAG）

import os import logging from fastapi import FastAPI, UploadFile, File, HTTPException from fastapi.responses import JSONResponse from dotenv import load_dotenv import shutil # RAG 相关 from langchain_community.document_loaders import PyPDFLoader from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain_openai import OpenAIEmbeddings, ChatOpenAI from langchain_community.vectorstores import Chroma from langchain_core.prompts import ChatPromptTemplate from langchain_core.output_parsers import StrOutputParser from langchain_core.runnables import RunnablePassthrough # ===================== 日志配置 ===================== logging.basicConfig(level=logging.INFO) logger = logging.getLogger(__name__) # ===================== 加载配置 ===================== load_dotenv() app = FastAPI(title="RAG 文档问答 API", version="2.0") # 创建目录 os.makedirs(os.getenv("UPLOAD_DIR"), exist_ok=True) # ===================== 模型初始化 ===================== llm = ChatOpenAI( api_key=os.getenv("DOUBAO_API_KEY"), base_url="https://ark.cn-beijing.volces.com/api/v3", model="doubao-pro-32k", temperature=0.0 ) embedding = OpenAIEmbeddings( api_key=os.getenv("DOUBAO_API_KEY"), base_url="https://ark.cn-beijing.volces.com/api/v3" ) # 全局变量 vector_db = None rag_chain = None # ===================== RAG 工具函数 ===================== def load_pdf_and_build_rag(pdf_path): global vector_db, rag_chain # 加载 loader = PyPDFLoader(pdf_path) docs = loader.load() # 分割 splitter = RecursiveCharacterTextSplitter( chunk_size=1000, chunk_overlap=200, separators=["\n\n", "\n", "。", "！", "？", " "] ) chunks = splitter.split_documents(docs) # 构建向量库 vector_db = Chroma.from_documents( documents=chunks, embedding=embedding, persist_directory=os.getenv("CHROMA_DB_DIR") ) vector_db.persist() # 构建 RAG retriever = vector_db.as_retriever(k=3) prompt = ChatPromptTemplate.from_template(""" 你是严格的文档问答助手，只根据下面的文档内容回答。 不知道就说：文档中没有相关内容。 文档： {context} 问题： {question} """) rag_chain = ( {"context": retriever, "question": RunnablePassthrough()} | prompt | llm | StrOutputParser() ) return len(chunks) def clear_knowledge_base(): global vector_db, rag_chain db_path = os.getenv("CHROMA_DB_DIR") if os.path.exists(db_path): shutil.rmtree(db_path) vector_db = None rag_chain = None # ===================== API 接口 ===================== @app.get("/", summary="健康检查") def health_check(): return {"status": "running", "message": "RAG API 服务正常"} @app.post("/upload-pdf", summary="上传PDF并构建知识库") def upload_pdf(file: UploadFile = File(...)): try: if not file.filename.endswith(".pdf"): raise HTTPException(status_code=400, detail="只支持PDF文件") save_path = os.path.join(os.getenv("UPLOAD_DIR"), file.filename) with open(save_path, "wb") as f: f.write(file.file.read()) chunk_num = load_pdf_and_build_rag(save_path) return JSONResponse({ "status": "success", "filename": file.filename, "chunk_count": chunk_num, "message": "PDF上传并构建知识库成功" }) except Exception as e: logger.error(f"上传失败：{str(e)}") raise HTTPException(status_code=500, detail=f"处理失败：{str(e)}") @app.post("/ask", summary="向RAG提问") def ask_question(question: str): try: if not vector_db or not rag_chain: raise HTTPException(status_code=400, detail="请先上传PDF构建知识库") answer = rag_chain.invoke(question) return JSONResponse({ "status": "success", "question": question, "answer": answer }) except Exception as e: logger.error(f"提问失败：{str(e)}") raise HTTPException(status_code=500, detail=f"处理失败：{str(e)}") @app.post("/clear", summary="清空知识库") def clear_db(): clear_knowledge_base() return {"status": "success", "message": "向量库已清空"} # ===================== 启动 ===================== if __name__ == "__main__": import uvicorn uvicorn.run( "main:app", host=os.getenv("HOST"), port=int(os.getenv("PORT")), reload=True )

4.`Dockerfile`（容器化打包）

dockerfile

FROM python:3.11-slim WORKDIR /app COPY requirements.txt . RUN pip install --no-cache-dir -r requirements.txt COPY . . EXPOSE 8000 CMD ["python", "main.py"]

5.`.dockerignore`

__pycache__ .env uploads/ chroma_db/ *.pyc *.pyo *.pyd

📖 第三步：详细功能说明（超级重要）

1. 提供4 个生产级 API

GET /→ 健康检查
POST /upload-pdf→ 上传 PDF，自动构建向量库
POST /ask?question=xxx→ 提问，返回 RAG 回答
POST /clear→ 清空知识库

2. 自动生成 API 文档（可视化！）

启动后访问：

http://localhost:8000/docs

你会看到Swagger UI 自动接口文档，可以直接在线测试！

3. 工程化特性

全局异常捕获
日志系统
类型校验
文件上传安全校验
环境变量配置
向量库持久化
状态管理（是否已上传 PDF）

🚀 第四步：运行方式（2 种）

方式 1：直接运行（本地测试）

python main.py

方式 2：Docker 容器运行（生产部署）

# 构建镜像 docker build -t rag-api . # 运行容器 docker run -p 8000:8000 rag-api

访问：http://localhost:8000/docs

🎯 第五步：API 调用示例（任何语言都能调用）

用 curl 调用

# 上传PDF curl -X POST "http://localhost:8000/upload-pdf" -F "file=@test.pdf" # 提问 curl -X POST "http://localhost:8000/ask?question=文档主要讲什么"

Python 调用

python

运行

import requests requests.post("http://localhost:8000/ask", params={"question":"什么是RAG"})

前端 / 小程序 / APP 都能调用！

🎯 第六步：你今天学到的硬核新知识

✅ FastAPI 集成 LangChain

✅ 文件上传 + PDF 处理

✅ RAG 系统接口化

✅ 全局异常处理

✅ 日志系统

✅ 环境变量配置

✅ Docker 容器化

✅ 生产级项目结构

✅ Swagger API 文档

查看全文

http://www.jsqmd.com/news/752711/

【YOLOv11】090、YOLOv11与强化学习：主动学习与智能数据采集

使用快马平台和cc-switch快速构建条件渲染组件原型

从‘电容泵水’到稳定供电：手把手分析电荷泵的三种电路拓扑（倍压、稳压、反压）

Postman便携版：如何实现零安装的API测试环境

实战应用：基于快马平台生成具备完整购物流程的9·1牛网专题页

开发者技能图谱构建指南：从知识清单到动态成长系统

构建模块化安全审计技能库：赋能自动化Agent与CI/CD安全左移

在 Node.js 服务中接入 Taotoken 实现异步聊天补全的完整示例

MongoDB的使用场景的庖丁解牛

SpringBoot AOP切面编程精讲：实现方式、Spring区别及与自定义注解生产实战

助睿数智 Uniplore 实验报告｜订单利润分流数据加工零代码 ETL 全流程——附完整操作步骤 + 踩坑指南，新手也能一次成功

Notepad--：跨平台国产文本编辑器的完整指南与高效使用技巧

GLA与GDN注意力机制对比：长序列建模的效率与性能优化

LeetCode 72. 编辑距离：动态规划经典题解

深入探索水下机器人仿真：专业级ROS平台实战指南

三步解决B站直播弹幕显示难题：BLiveChat让OBS互动更专业

Translumo屏幕实时翻译工具终极指南：5分钟掌握高效跨语言沟通技巧

PhysMaster：基于强化学习的物理合理视频生成技术解析

体验Taotoken多模型聚合路由带来的服务稳定性提升

别再只用WebRTC了！用LiveKit Server + Go 手把手搭建一个低延迟的Web音视频聊天室

基于Logistic98/chatgpt-fine-tuning项目的GPT模型微调实战指南

保姆级教程：用VMware Workstation 17在Windows电脑上体验macOS Monterey（附AMD CPU避坑配置）

Apollo Save Tool：终极PS4存档管理解决方案，轻松备份和修改游戏进度

如何在3分钟内为Windows 11 LTSC系统安装微软商店：终极完整指南

微信Dat文件的前世今生：从异或加密到WxDatViewer，聊聊数据安全与隐私保护

CH582单片机SysTick定时器实战：1秒精准闪烁LED（附串口打印调试技巧）

MySQL执行计划优化 = 加索引？

告别纸上谈兵：在浏览器里用MARIE.js写你的第一个汇编程序（含完整代码）

2026届学术党必备的五大AI辅助论文网站推荐

Masa Mods汉化资源包：让Minecraft模组界面彻底说中文的完整指南