当前位置: 首页 > news >正文

AI开发-python-milvus向量数据库(2-5 -milvus-极简模式创建表collection)

向量库中有极简创建collection的方式,只指定必须要填写的字段其他都用默认值就可以

看代码:

# 过滤 pymilvus 依赖的 pkg_resources 废弃警告(setuptools≥81 版本触发)
# 目的是消除版本兼容带来的无关警告,让控制台输出更整洁
import warnings
warnings.filterwarnings("ignore", message=".*pkg_resources is deprecated as an API.*")from pymilvus import MilvusClient, DataType# 配置 Milvus 集群连接信息
# 集群访问地址(IP+端口),19530 是 Milvus 的默认 HTTP 端口
CLUSTER_ENDPOINT = "http://192.168.211.128:19530"
# 认证令牌,格式为 "用户名:密码",默认管理员账号是 root,密码是 Milvus
TOKEN = "root:Milvus"# 初始化 Milvus 客户端,建立与集群的连接
client = MilvusClient(uri=CLUSTER_ENDPOINT,  # 集群地址token=TOKEN            # 认证令牌
)# ===================== 示例1:极简模式创建集合 =====================
# 创建名为 "quick_setup" 的集合,使用默认参数
# 仅指定集合名和向量维度(5维),其余参数均使用 Milvus 默认值
client.create_collection(collection_name="quick_setup",  # 集合名称(唯一标识)dimension=5                     # 向量字段的维度(必须指定)
)# 查询集合的加载状态(Milvus 中集合需加载到内存才能进行搜索/查询)
res = client.get_load_state(collection_name="quick_setup"
)
# 打印加载状态(未手动加载时,状态通常为 "NotLoad")
print(res)
print('-----------------')# ===================== 示例2:自定义参数创建集合 =====================
# 创建名为 "custom_quick_setup" 的集合,自定义多个核心参数
client.create_collection(collection_name="custom_quick_setup",  # 集合名称dimension=5,                           # 向量维度primary_field_name="my_id",            # 主键字段名(默认是 "id")id_type="string",                      # 主键类型(可选 int64/string,默认 int64)vector_field_name="my_vector",         # 向量字段名(默认是 "vector")metric_type="L2",                      # 向量相似度计算方式(L2:欧式距离,默认 COSINE:余弦相似度)auto_id=True,                          # 是否自动生成主键(默认 False)max_length=512                         # 当主键为 string 类型时,指定最大长度(必填)
)# 查询自定义集合的加载状态
res = client.get_load_state(collection_name="custom_quick_setup"
)
# 打印加载状态
print(res)

 输出的结果:

{'state': <LoadState: Loaded>}
-----------------
{'state': <LoadState: Loaded>}

 

核心知识点回顾

 
Milvus 集合创建核心规则
 
    • 创建集合时 必须指定向量维度(dimension),这是唯一的必填基础参数;
    • 若不指定自定义参数,Milvus 会使用默认值(如主键名 id、主键类型 int64、相似度计算方式 COSINE 等)。
     
  1. 自定义参数关键注意事项
     
    • id_type 设为 string 时,必须搭配 max_length 指定字符串主键的最大长度;
    • auto_id=True 表示由 Milvus 自动生成主键,无需手动插入主键值,简化数据写入流程;
    • 常用的 metric_type 有两种:L2(欧式距离,适合数值型向量)、COSINE(余弦相似度,适合归一化后的向量)。
     
  2. 集合加载状态说明
     
    • get_load_state() 用于查询集合是否加载到内存,新创建的集合默认状态为 NotLoad
    • 集合需通过 load_collection() 手动加载后,才能执行向量搜索 / 查询操作。
       
更多学习资料尽在老虎网盘资源:http://resources.kittytiger.cn/ 老虎网盘资源
http://www.jsqmd.com/news/384148/

相关文章:

  • 2026年成都管道疏通推荐:多场景管道问题实测评价,解决堵塞与渗漏痛点 - 十大品牌推荐
  • 06_C 语言数据结构与算法:哈希表(散列表)—— O(1)查找的终极方案:从0到1避坑指南(附完整代码)
  • 两级三相光伏并网逆变器控制Matlab/Simulink仿真模型,mppt控制有扰动观察法和电...
  • 深入浅出:LLM/VLM监督微调(SFT)核心技术解析与实践指南
  • 改进的数值解析法PCB热建模方法,考虑辐射传热及元件温度计算(Matlab代码实现)
  • 世界模型深度解析:从Transformer到产业落地的核心原理
  • 改进距离继电器中功率摆动阻塞和解阻塞功能的新方法(Matlab代码实现)
  • Golang实现豆包大模型2.0企业级Agent架构与成本优化实战
  • 程序判断滤波法:从核心原理到工程实战,一篇讲透
  • 原来这才是 Kafka!(多图+深入)
  • 从感知到行动:Vision-Language-Action大模型核心解析与实战指南
  • 考虑需求响应的电-热综合能源系统两阶段日前日内多时间尺度优化调度策略研究(Matlab代码实现)
  • 农民变农机程序员,功能,用python写脚本,控制农机动作,输入,自定义任务脚本,处理,解析执行,输出,农机自主完成任务。
  • 为什么我使用了索引,查询还是慢?
  • 从原理到实战:Vision Encoder 完全学习指南
  • 通用幂等组件设计与实现(详解)
  • 用好 Java 中的枚举,真的没有那么简单!
  • 2026 2月,盘点市面上宠物医院美团代运营靠谱团队,宠物医生代运营/宠物服务代运营,宠物医院美团代运营公司选哪家 - 品牌推荐师
  • 【译】应用 Visual Studio 2026 简化您的 Git 工作流程
  • ipad mini拿来当论文阅读器
  • 99.下一个排列
  • 基于COMSOL偏微分方程(PDE)的生物堵塞模型构建与研究
  • 为并发而生的 ConcurrentHashMap —— 基于 Java 8 源码深度剖析
  • 2026年管道疏通服务哪家强?郴州地区专业评测与场景化推荐 - 十大品牌推荐
  • 关于air001
  • 别人的成功,可能正好是你的干扰项
  • 如何选择郴州管道疏通服务?2026年推荐与评测解决堵塞与清淤痛点 - 十大品牌推荐
  • 2026年2月北京丰台区养护院推荐,照护标准与安全管理全面解析 - 品牌鉴赏师
  • 涨姿势:为什么 Java 中 “1000==1000” 为 false,而 ”100==100“ 为 true?
  • 浅谈随机化与模拟退火