当前位置：首页 > news >正文

AI开发-python-milvus向量数据库（2-12 -milvus-向量检索）

news 2026/3/26 22:28:21

在向量数据库的实际应用中，Milvus 凭借高效的近似最近邻（ANN）检索能力成为主流选择。本文将以实战视角，拆解基于 PyMilvus 客户端完成向量相似度查询的全流程，帮你快速掌握从服务连接、集合加载到结果解析的核心要点。

一、场景背景：为什么要做向量相似度查询？

向量检索的核心是通过计算向量间的相似度，找到与目标向量最匹配的结果，广泛应用于图像检索、文本语义匹配、推荐系统等场景。其中余弦相似度是最常用的度量方式之一，它聚焦向量方向的相似性，取值范围在 [-1,1] 之间 ——1 代表向量方向完全一致，-1 代表完全相反，0 则无相关性，这种特性使其特别适合语义类场景的相似度判断。

二、核心流程拆解：从连接 Milvus 到获取检索结果

建立 Milvus 连接

初始化 MilvusClient 是交互的基础，只需指定 Milvus 服务的 URI 和认证令牌（用户名 + 密码），即可建立客户端与服务端的连接，这是所有操作的前提。
集合加载：确保数据可检索

Milvus 中存储向量的集合需要先加载到内存才能执行检索操作，即使集合已加载，显式调用加载方法也不会重复执行，可放心使用。加载后通过验证加载状态，能避免因集合未加载导致的检索失败。
执行向量检索

检索的核心是指定待查询向量、目标集合、向量字段名，以及需要返回的业务字段（如示例中的 color 字段）。需要注意的是，查询向量的维度必须与集合中向量字段的维度一致，否则会检索失败；而返回结果的数量可通过 limit 参数控制，满足 “取 Top-N 相似结果” 的常见需求。
结果解析：读懂相似度数值

检索结果中最核心的是 distance 字段 —— 在余弦相似度度量下，该值有正有负，比如 0.689 代表较高相似度，-0.208 则代表相似度较低（向量方向相反）。同时结果中会包含业务字段（如 color），方便将向量检索结果与实际业务数据关联。

三、关键知识点：余弦相似度 vs 欧氏距离

在 Milvus 的向量检索中，选择合适的度量方式直接影响结果有效性：

余弦相似度：不关注向量长度，只聚焦方向，取值 [-1,1]，适合文本语义、图像特征等 “方向相似” 的场景；
欧氏距离：衡量向量在空间中的实际距离，取值为非负实数，值越小越相似，适合需要考虑向量幅值的场景（如图像像素特征匹配）。

四、实操小技巧

检索前务必验证集合加载状态，避免因集合未加载导致检索无结果；
解析结果时注意业务字段的嵌套结构，避免因字段层级错误导致解析失败；
若未指定 metric_type，Milvus 会默认使用集合创建时配置的度量方式，需提前确认集合的度量类型，避免误解相似度数值的含义。

总结

基于 PyMilvus 的向量检索核心是 “连接 - 加载 - 检索 - 解析” 四步，掌握余弦相似度的数值含义、集合加载的关键操作，以及结果解析的细节，就能快速落地向量检索的实际应用。无论是语义匹配还是图像检索，这套流程都能适配大部分场景，帮助开发者高效利用 Milvus 完成向量数据的检索分析。

代码如下：

# 过滤 pymilvus 依赖的 pkg_resources 废弃警告（setuptools≥81 版本触发）
# 目的是消除版本兼容带来的无关警告，让控制台输出更整洁，不影响核心功能查看
import warnings
warnings.filterwarnings("ignore", message=".*pkg_resources is deprecated as an API.*")
# 导入 Milvus 客户端核心类，用于与 Milvus 数据库建立连接和交互
from pymilvus import MilvusClient# ====================== 1. 初始化 Milvus 客户端 ======================
# 创建 Milvus 客户端实例，指定连接信息
client = MilvusClient(uri="http://192.168.211.128:19530",  # Milvus 服务的地址和端口token="root:Milvus"  # 认证令牌（格式：用户名:密码）
)# ====================== 2. 配置集合相关参数 ======================
# 定义要查询的集合名称（需确保该集合已存在且包含向量字段）
collection_name = "insert_collection"# ====================== 3. 加载集合到内存 ======================
# 显式加载集合到内存，Milvus 中只有加载后的集合才能执行向量检索
# 若集合已加载，此操作不会重复执行，可放心调用
client.load_collection(collection_name=collection_name)# 验证集合加载状态（等待加载完成，确保检索能正常执行）
load_state = client.get_load_state(collection_name=collection_name)
print("----查看集合加载状态----")
print(f"集合 {collection_name} 加载状态：{load_state}")  # 正常输出应为：{'state': 'Loaded'}# ====================== 4. 执行向量相似度检索 ======================
# 定义待查询的向量（维度需与集合中 "vector" 字段的维度一致，此处为 5 维）
# query_vector = [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]
query_vector = [0.4452349528804562, -0.8757026943054742, 0.8220779437047674, 0.46406290649483184, 0.30337481143159106]# 执行向量检索
res = client.search(collection_name=collection_name,  # 要查询的集合名称anns_field="vector",  # 集合中存储向量的字段名data=[query_vector],  # 待查询的向量列表（支持批量查询，此处仅1个）limit=10,  # 返回相似度最高的前10条结果output_fields=["color"]  # 指定除向量外要返回的字段（如业务字段color）# 注：若未指定 metric_type，默认使用集合创建时配置的相似度度量方式
)# ====================== 5. 解析并输出检索结果 ======================
print("\n----向量检索结果（前10条）----")
for hits in res:for hit in hits:print(hit)#distance 余弦相似度值# ====================== 相似度度量方式说明 ======================
"""
Milvus 常用的两种相似度度量方式核心含义：
1. 余弦相似度（Cosine Similarity）：- 取值范围：[-1, 1]- 含义：1 表示两个向量方向完全相同（完全相似），-1 表示方向完全相反，0 表示无相关性- 特点：对向量长度不敏感，仅关注方向，适合文本语义相似度、图像特征匹配等场景2. 欧氏距离（Euclidean Distance）：- 取值范围：非负实数（≥0）- 含义：值越小表示两个向量在空间中的距离越近（越相似），0 表示完全重合- 特点：对向量绝对值敏感，适合需考虑向量幅值的场景（如图像像素特征）
"""

输出结果如下：

----查看集合加载状态----
集合 insert_collection 加载状态：{'state': <LoadState: Loaded>}

----向量检索结果（前10条）----
{'id': 4, 'distance': 1.0, 'entity': {'color': 'red_4794'}}
{'id': 2, 'distance': 0.9353201389312744, 'entity': {'color': 'orange_6781'}}
{'id': 5, 'distance': 0.8381294012069702, 'entity': {'color': 'yellow_4222'}}
{'id': 7, 'distance': 0.6895773410797119, 'entity': {'color': 'grey_8510'}}
{'id': 6, 'distance': -0.20802533626556396, 'entity': {'color': 'red_9392'}}
{'id': 3, 'distance': -0.4447822570800781, 'entity': {'color': 'pink_9298'}}

更多学习资料尽在老虎网盘资源：http://resources.kittytiger.cn/ 老虎网盘资源

查看全文

http://www.jsqmd.com/news/412149/