当前位置: 首页 > news >正文

向量数据库常用SQL语句

向量数据库常用SQL语句

创建包含向量字段的表

CREATETABLEproducts(idSERIALPRIMARYKEY,nameVARCHAR(100),descriptionTEXT,embedding VECTOR(1536)-- 假设使用1536维向量);

插入向量数据

INSERTINTOproducts(name,description,embedding)VALUES('智能手机','高端旗舰手机','[0.1, 0.2, ..., 0.5]');

向量相似度查询(以pgvector为例)

SELECTid,name,1-(embedding<=>'[0.3, 0.1, ..., 0.4]')ASsimilarityFROMproductsORDERBYembedding<=>'[0.3, 0.1, ..., 0.4]'LIMIT10;

创建向量索引

CREATEINDEXONproductsUSINGivfflat(embedding vector_l2_ops)WITH(lists=100);-- 针对IVFFlat索引

典型应用案例

案例1:商品推荐系统

基于用户浏览历史的向量相似度推荐

# 假设已获取用户浏览记录的向量表示user_vector=[0.2,0.15,...,0.3]# 使用pgvector查询相似商品query=""" SELECT id, name, 1 - (embedding <=> %s) AS similarity FROM products WHERE category = 'electronics' ORDER BY embedding <=> %s LIMIT 5 """cursor.execute(query,(user_vector,user_vector))

案例2:语义搜索实现

文本语义相似度搜索

fromsentence_transformersimportSentenceTransformer model=SentenceTransformer('all-MiniLM-L6-v2')# 将搜索查询转换为向量query_text="续航持久的蓝牙耳机"query_vector=model.encode(query_text).tolist()# 向量数据库查询similar_products=collection.query(query_embeddings=[query_vector],n_results=3,include=["metadata","distances"])

代码实现示例

使用FAISS实现(Python)

importfaissimportnumpyasnp# 创建索引dimension=768index=faiss.IndexFlatIP(dimension)# 添加向量数据vectors=np.random.rand(1000,dimension).astype('float32')index.add(vectors)# 相似度搜索query_vector=np.random.rand(1,dimension).astype('float32')D,I=index.search(query_vector,k=5)# 返回前5个最相似结果

使用Milvus向量数据库

frompymilvusimportconnections,Collection# 连接数据库connections.connect("default",host="localhost",port="19530")# 获取集合collection=Collection("products")# 向量搜索search_params={"metric_type":"L2","params":{"nprobe":10}}results=collection.search(data=[query_vector],anns_field="embedding",param=search_params,limit=5,output_fields=["name"])

性能优化技巧

索引参数调优(以IVF_FLAT为例)

-- 调整nlist参数平衡查询精度和速度CREATEINDEXONproductsUSINGivfflat(embedding vector_l2_ops)WITH(lists=500);

混合查询(结合向量和标量过滤)

SELECTid,nameFROMproductsWHEREprice<1000ANDembedding<=>'[0.1, ..., 0.2]'<0.3ORDERBYembedding<=>'[0.1, ..., 0.2]'LIMIT10;

向量量化技术应用(如PQ编码)

# 使用Faiss的PQ压缩quantizer=faiss.IndexFlatL2(dimension)index=faiss.IndexIVFPQ(quantizer,dimension,100,16,8)# 100个簇,16个子向量,8bits
http://www.jsqmd.com/news/109918/

相关文章:

  • 47、深入了解 NNTP 协议及其应用
  • Kotaemon与LangChain对比:谁更适合生产环境?
  • Kotaemon能否用于图书馆检索?公共文化服务创新
  • 批量将 Word 文档重命名为其标题
  • 我发现动态病例生成补足医学教育短板,三甲医院培训效率翻倍
  • 我发现扩散模型生成合成基因数据,罕见病跨境早筛灵敏度翻倍
  • Conreg:Rust生态的轻量配置与注册中心
  • 为什么我们需要补充欧米伽-3?海豹油的全面营养成分解析
  • KotaemonAPI文档生成:Swagger/YAML自动填充
  • 【项目实战】md 是标准纯文本标记语言,mdx 是其扩展格式(融合 JSX/组件能力)
  • 10、TCP/IP 网络配置全攻略
  • Kotaemon前缀缓存机制:加速重复查询响应
  • Kotaemon支持GraphQL接口吗?现代API集成方案
  • 若依报错Server returns invalid timezone. Go to ‘Advanced‘ tab and set ‘serverTimezone‘ property manually
  • Kotaemon能否支持语音转文字后进行检索?
  • 库早报|刚刚,这家合肥3D打印公司获融资;鸿日达与联想摩托罗拉布局3D打印;东北大学200万元采购电子束设备
  • 46、C News系统的配置、维护与消息处理
  • BXMya BENTLY 3500/94 145988-01 机架接口模块
  • 企业级BS模式冷链物流系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 高校科研团队如何用Kotaemon做学术知识图谱问答?
  • BXMya IC698PSA100E 冗余电源模块
  • 企业级智能问答系统怎么选?Kotaemon告诉你答案
  • LangChain、 Dify、 n8n、 Coze:四大AI框架怎么选?
  • Kotaemon围棋棋局分析:胜率预测与建议
  • Kotaemon播客脚本生成:节目大纲与台词
  • Kotaemon能否做情感分析?用户情绪识别初步尝试
  • 谁在捧杀豆包手机?
  • web城乡居民基本医疗信息管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • 基于Kotaemon的政策法规智能查询系统
  • 单片机基础知识(八)8080时序