当前位置：首页 > news >正文

RAG实战：用LangChain4j构建企业级知识库问答系统

news 2026/6/18 23:19:30

前言

RAG（Retrieval-Augmented Generation，检索增强生成）是当前企业落地大模型最主流的方案。它解决了大模型"幻觉"和"知识截止"两大痛点，让 AI 能够基于企业私有知识库进行精准问答。本文用 LangChain4j 带你从零构建一个完整的 RAG 系统。

一、RAG 核心原理

RAG 的工作流程分三步：

索引阶段：将文档切片 → 向量化 → 存入向量数据库
检索阶段：用户提问 → 向量化 → 相似度检索 → 召回相关文档片段
生成阶段：将召回内容 + 用户问题拼接为 Prompt → 大模型生成答案

二、环境准备

<!-- pom.xml -->
<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j</artifactId><version>0.36.0</version>
</dependency>
<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-open-ai</artifactId><version>0.36.0</version>
</dependency>
<dependency><groupId>dev.langchain4j</groupId><artifactId>langchain4j-embeddings-all-minilm-l6-v2</artifactId><version>0.36.0</version>
</dependency>

三、文档加载与切片

// 加载文档
Document document = FileSystemDocumentLoader.loadDocument(Paths.get("knowledge-base/company-faq.txt"),new TextDocumentParser()
);// 文档切片（每片500字符，重叠50字符）
DocumentSplitter splitter = DocumentSplitters.recursive(500, 50);
List<TextSegment> segments = splitter.split(document);System.out.println("切片数量: " + segments.size());

四、向量化与存储

// 使用本地嵌入模型（无需 API Key）
EmbeddingModel embeddingModel = new AllMiniLmL6V2EmbeddingModel();// 使用内存向量库（生产环境可换 Milvus/Pinecone）
EmbeddingStore<TextSegment> embeddingStore = new InMemoryEmbeddingStore<>();// 批量向量化并存储
EmbeddingStoreIngestor ingestor = EmbeddingStoreIngestor.builder().documentSplitter(DocumentSplitters.recursive(500, 50)).embeddingModel(embeddingModel).embeddingStore(embeddingStore).build();ingestor.ingest(document);
System.out.println("文档已向量化并存入知识库");

五、构建问答链

// 定义 AI 服务接口
interface KnowledgeBaseAssistant {String answer(String question);
}// 配置 RAG 检索器
ContentRetriever contentRetriever = EmbeddingStoreContentRetriever.builder().embeddingStore(embeddingStore).embeddingModel(embeddingModel).maxResults(3)          // 召回最相关的3个片段.minScore(0.6)          // 相似度阈值.build();// 构建 AI 服务
KnowledgeBaseAssistant assistant = AiServices.builder(KnowledgeBaseAssistant.class).chatLanguageModel(OpenAiChatModel.builder().apiKey(System.getenv("OPENAI_API_KEY")).modelName("gpt-4o-mini").build()).contentRetriever(contentRetriever).build();// 开始问答
String answer = assistant.answer("公司的退款政策是什么？");
System.out.println("AI回答: " + answer);