当前位置：首页 > news >正文

06-milvus-vector-rag RAG 基础：文档加载、切分、向量化与检索增强

news 2026/7/2 10:29:21

LangChain4j 进阶实战：第 6 篇，Milvus 向量库实战，上传文档并完成 RAG 问答

1. 为什么要从 InMemory 升级到 Milvus

上一章的 RAG 使用了InMemoryEmbeddingStore，它适合学习，但不适合生产。

原因很直接：

服务重启后数据丢失。
多实例之间不能共享。
文档量大时内存压力高。
无法做长期索引管理。
很难做增量更新、删除和运维监控。

生产环境需要外部向量数据库。这里以 Milvus 为例，讲清楚配置、写入、检索、元数据和业务实体向量化的完整思路。

2. 配置 Milvus

基础配置通常长这样：

milvus:host:${MILVUS_HOST}port:${MILVUS_PORT}username:${MILVUS_USERNAME}password:${MILVUS_PASSWORD}database-name:kaleidocollection-name:testdimension:1536

如果你的项目里还用了 Spring AI，配置形态也类似：

spring:ai:vectorstore:milvus:client:host:${MILVUS_HOST}port:${MILVUS_PORT}username:${MILVUS_USERNAME}password:${MILVUS_PASSWORD}database-name:kaleidocollection-name:kaleido_collectioninitialize-schema:trueembedding-dimension:1536indexType:IVF_FLATmetricType:COSINE

这里有两个特别关键的参数：

dimension：必须和 embedding 模型输出维度一致。
metricType：常见是COSINE，用于语义相似度。

3. 上传文档接口

文档上传接口可以这样设计：

@PostMapping("/upload")publicStringuploadDocument(@RequestParam("file")MultipartFilefile){if(file.isEmpty()){return"上传的文件为空";}uploadDocumentToMilvus(file);isDocumentUploaded=true;return"文档上传成功";}

这是一条典型的文档入库链路：

MultipartFile -> Tika 解析 -> Document -> Split -> Embedding -> Milvus

我的理解是：向量库不是用来存原始文档的，而是用来存“可被语义检索的文档片段”。原始文件最好仍然存对象存储，向量库存片段、向量和元数据。

4. 用 Apache Tika 解析文档

上传复杂文件时，可以用 Tika 解析：

try(InputStreaminputStream=file.getInputStream()){ApacheTikaDocumentParserparser=newApacheTikaDocumentParser();document=parser.parse(inputStream

查看全文

http://www.jsqmd.com/news/798048/

破解复杂地形运输痛点：履带运输车定制厂家的场景三维定制方法论如何实现高效降本？ - 速递信息

福建UCC国际洗衣门店：实用体验值得客观评鉴 - 企业推荐官【官方】

告别‘堆已损坏’：深入理解malloc/new在Win32与x64平台下的内存管理差异

Python 爬虫高级实战：开源爬虫框架二次改造实战

如何快速上手RobotHelper：安卓自动化脚本的终极指南

高并发场景下SimpleDateFormat线程安全陷阱与现代化替代方案

2026 年洛阳偃师区黄金回收，哪家团队更靠谱？ - 企业推荐官【官方】

NoFences：免费开源桌面分区管理工具，让你的Windows桌面告别混乱

如何3步完成微博备份：Speechless免费Chrome扩展终极指南

从芯片手册到真实波形：用Multisim仿真复现74LS74触发器搭建的加减法计数器

macOS Big Sur下雷蛇雷云2.0驱动失效的深层解析与kext手动加载指南

黑奥秘加盟适合新手吗？新手养发创业可行性深度分析 - 企业推荐官【官方】

别再死记硬背了！用Python模拟下推自动机（PDA）识别0^n1^n语言，5分钟搞懂计算过程

2026年，西安这些口碑好的保姆企业名声究竟靠啥打响？ - 企业推荐官【官方】

DSP+FPGA异构架构在实时信号处理中的应用与优化

仅限本周开放！Google Docs高级写作工作流密钥包（含12个经Gmail+Drive+Meet交叉验证的Gemini Prompt黄金组合）

CPUBone：优化CPU视觉骨干网络的卷积策略

05 对称二叉树

AcceRL框架：异步强化学习优化与硬件加速实践

HS2汉化补丁终极指南：3步轻松搞定Honey Select 2中文界面

别再只调OpenCV了！深入Sobel算子：从数学推导到C++手写实现（对比FPGA方案）

开源安全守卫OpenClaw：一体化安全运营平台架构与实战部署

5分钟解决经典游戏兼容问题：DDrawCompat让你的老游戏在现代Windows上重生！

Windows Defender Remover：彻底移除Windows安全组件，实现系统性能加速30%

OpenEuler 22.03 LTS 图形界面安装踩坑实录：从网络检查到GDM修复，一篇搞定

免费AI图像修复神器：Real-ESRGAN-GUI终极使用指南

科技与科学领域重点新闻摘要-2026年5月11日

OpenDRIVE路网导入Unity的避坑指南：从Bezier曲线生成到多车道纹理渲染的实战复盘

珠海金湾管道疏通马桶疏通地漏疏通洗菜池疏通清理化粪池30分钟快速上门 - 企业推荐官【官方】

LangChain4j 进阶实战：第 6 篇，Milvus 向量库实战，上传文档并完成 RAG 问答

1. 为什么要从 InMemory 升级到 Milvus

2. 配置 Milvus

3. 上传文档接口

4. 用 Apache Tika 解析文档

相关文章：