当前位置：首页 > news >正文

RAG-向量数据库Milvus

news 2026/6/26 12:25:27

Milvus是开源的分布式向量数据库，非常适合大规模的向量检索场景

优点：高性能检索、弹性扩展、生态完善

官网的Milvus高度解耦的系统架构图

基本概念

以下介绍下向量数据库的基本概念，以便快速了解。想要深入研究请看官网：https://Milvus.io/docs/zh/create-collection.md

数据库（Database）

数据库是组织和管理数据的逻辑单元。你可以创建多个数据库，为不同的应用程序或租户从逻辑上隔离数据

集合(Collection)

向量数据存放的容器，相当于数据库中的表

所有向量按照业务存储在collection里
每个collection有固定的Schema结构
增删改查都在collection上操作

字段（Field）

相当于mysql表中的列，一个集合有：

主键字段（必须）
向量字段（必须，指定维度dim）
其他标量字段（int/string/bool等）

实体（Entity）

一行数据、有主键ID+向量+标量字段

向量（Vector）

浮点数组，如[0.1, 0.2, 0.3, …, 0.768]。由模型（BGE）把文本、图片、音频转成特征表示。常见维度：768、1024、1536

分区（Partition）

分区是集合的子集，对集合做数据分组。当创建一个集合时，默认会创建一个**_default 的**分区。如果不增加其他分区，插入到集合的实体数据都会进入默认分区。创建分区会加快查询，缩小扫描范围

索引（Index）

快速检索结构，没有索引全表遍历很慢，有了索引加快搜索速度

FLAT: 暴力全比对向量，最准但最慢，适合小数据

官方例子：

#建立索引 ndex_params.add_index( field_name="your_vector_field_name", # 要给哪个向量字段建索引（表中的向量列名） index_type="FLAT", # 索引类型：FLAT index_name="vector_index", # 给索引起个名字 metric_type="L2", # 相似度计算方式：L2距离 params={} # FLAT 不需要任何额外参数 ) #在索引上搜索 res = MilvusClient.search( collection_name="your_collection_name",# 集合名称（就是你存向量的“表名”） anns_field="vector_field", # 向量字段名（表里存向量的列名） data=[[0.1, 0.2, 0.3, 0.4, 0.5]], # 要查询的向量（你拿这个向量去搜相似的） limit=3, # 返回最相似的前 3 条结果（TopK） search_params={"params": {}} # FLAT 索引不需要额外参数 )

IVF_FLAT: 先将向量聚类分桶，再查桶，快、常用。

解释：如果把向量比做成书籍的话。这个算法（IVF）就是通过K-Means将书籍进行归类（分区），把书籍放在不同的书架。具体会划分多少书架，得看设置的nlist，nlist是多少，就会将书籍划分成多少个书架。所以在进行向量检索的时候，只需要检索相近的几个分区就能快速的找到向量了。设置nprobe,nprobe代表检索相近几个分区。FLAT则是完整保存向量，不压缩，比对距离时是精准原始计算，没有精度损耗。

官方例子

#建立索引 index_params.add_index( field_name="your_vector_field_name", # 要给哪个向量字段建索引（表中的向量列名） index_type="IVF_FLAT", # 索引类型：IVF_FLAT index_name="vector_index", # 给索引起个名字 metric_type="L2", # 相似度计算方式：L2距离 params={ "nlist": 64, # nlist 越大，则分区越多，单个分区数据少，检索速度快；nlist 越小，单个分区的数据就越大，检索的速度不快 } ) #在索引上搜索 search_params = { "params": { "nprobe": 10, # nprobe越大，则检索越准确，但是检索慢；nprobe越小，则检索越快，但是容易漏掉结果； } } res = MilvusClient.search( collection_name="your_collection_name", # 集合名称 anns_field="vector_field", data=[[0.1, 0.2, 0.3, 0.4, 0.5]], # 查询向量 limit=3, # 返回 Top3 search_params=search_params )

IVF_SQ8: 对向量压缩，省内存，精度略降

解释：在分区的逻辑上和IVF_FLAT一样，唯一的区别是对向量进行了高强度压缩，只保留核心特征，丢掉了微小的细节。所以这种索引节省了大量的内存空间

官方例子

#建立索引 index_params.add_index( field_name="your_vector_field_name", # 要给哪个向量字段建索引（表中的向量列名） index_type="IVF_SQ8", # 索引类型：IVF_SQ8 index_name="vector_index", # 给索引起个名字 metric_type="L2", # 相似度计算方式：L2距离 params={ "nlist": 64, # nlist 越大，则分区越多，单个分区数据少，检索速度快；nlist 越小，单个分区的数据就越大，检索的速度不快 } ) #在索引上搜索 search_params = { "params": { "nprobe": 8, # 检索相近分区的数量 } } res = MilvusClient.search( collection_name="your_collection_name", anns_field="vector_field", data=[[0.1, 0.2, 0.3, 0.4, 0.5]], limit=10, search_params=search_params )

HNSW: 基于图结构，查询最快，精度最高，耗内存

解释: 每个向量都与其他向量相连，组成一个超大的关系网络图，多层立体地图。向量完整原始保存，不压缩，不分区。向量检索通过地图进行跳跃查找。

官方例子

#建立索引 index_params.add_index( field_name="your_vector_field_name", # 要给哪个向量字段建索引（表中的向量列名） index_type="HNSW", # 索引类型：HNSW index_name="vector_index", # 给索引起个名字 metric_type="L2", # 相似度计算方式：L2距离 params={ "M": 64, # :每个节点可连接的最大邻居数量 "efConstruction": 100 # 索引构建过程中考虑连接的候选邻居数量 } ) #在索引上搜索 search_params = { "params": { "ef": 10, #搜索时要考虑的邻居数量 } } res = MilvusClient.search( collection_name="your_collection_name", anns_field="vector_field", data=[[0.1, 0.2, 0.3, 0.4, 0.5]], limit=10, search_params=search_params )

SCANN: 平衡速度与精度，高召回场景用

解释：结合了以上IVF、SQ8、HNSW的优点：

先像IVF一样：划分大区、粗分区，先大范围缩小搜索范围
再像SQ8一样：局部向量压缩，控制内存
最后像HNSW一样：在分区内部，搭建小型邻居网络图，精细快速检索

官方例子

#建立索引 index_params.add_index( field_name="your_vector_field_name", # 要给哪个向量字段建索引（表中的向量列名） index_type="SCANN", # 索引类型：SCANN index_name="vector_index", # 给索引起个名字 metric_type="L2", # 相似度计算方式：L2距离 params={ "with_raw_data": True, # 是否在存储量化表示的同时存储原始向量数据。 } ) #在索引上搜索 search_params = { "params": { "reorder_k": 10, # 在重新排序阶段要细化的候选实体数量 "nprobe": 8 # 要搜索的分区 } } res = MilvusClient.search( collection_name="your_collection_name", anns_field="vector_field", data=[[0.1, 0.2, 0.3, 0.4, 0.5]], limit=10, search_params=search_params )

DISKANN: 磁盘级图索引，向量落盘存储，适合海量向量+SSD环境
解释：把向量本体全部存在磁盘，内存只留导航索引，用磁盘换容量、省机器内存，速度略弱HNSW，远超 IVF 系列，是超大规模向量库的低成本方案。
官方案例：
默认情况下，Milvus会禁用DISKANN，以优先提高内存中索引的速度，以适应RAM中的数据集。
Milvus.yaml配置：
```
common: DiskIndex: MaxDegree: 56 # 每个向量最多连多少条“邻居线” SearchListSize: 100 # 搜索时一次查多少候选 PQCodeBudgetGBRatio: 0.125 # 向量压缩比例，压缩到原来的 1/8 SearchCacheBudgetGBRatio: 0.1 # 内存里放多少缓存 BeamWidthRatio: 4 # 磁盘读取并发度
```

总结

索引的选择：

场景	索引
数据量小，追求绝对精准，不在乎速度	FLAT
常规业务，百万级向量，平衡好用	IVF_FLAT
海量向量，内存紧张	IVF_SQ8
线上高并发、接口低延迟、不差内存	HNSW
海量向量、高召回、省内存、速度快	SCANN
海量向量、内存极小、依赖高速 SSD、低成本扩容	DISKANN

相似度量（Metric Type）

Milvus通过不同的距离计算方式，判断两个向量之间的相似度，三种常用度量规则如下：

L2(欧式距离)：计算向量空间直线距离，数值越小，向量越相似
IP(内积)：计算向量关联程度，数值越大，向量越相似
CONSINE(余弦)：直比对向量方向，不关注长度，数值越大，语义/特征越相似

检索（Search）

向量检索即相速度查询：业务传入一个目标查询向量，Milvus根据选定的向量相似度度量公式，在向量索引中快速比对所有向量，最终返回TOP-K相似度最高的匹配结果。

总结

以上就是Milvus向量数据库的简单介绍，想要深入了解的同学可以去官网研究。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～