当前位置: 首页 > news >正文

PYTHON+AI LLM DAY EIGHTY-SEVEN

今天简单介绍一下milvus向量库中的混合检索方法.混合检索的目的也就是从不同向量场实现对问题的精准查询,这也是milvus向量库的一大优点.milvus向量库支持的混合检索的方式有两种.也是常说的排序器.分别是加权排名策略(WeightedRanker)和重排序策略(RRFRanker).它们的区别在于对最后向量场的上分配的权重上的区别.WeightedRanker对不同的向量场使用不同的权重(重要性),所有向量场的权重的和为1.RRFRanker对待每个向量场则没有权重限制,也就是每个向量场是等权重.这里说的向量场.大致意思就是说:先回顾一下milvus向量库存储的数据,主要是向量形式.就是各种非结构化数据转化成一串数字存入milvus向量库(向量存储).每一个milvus表里面最多只能有4种类型向量.这里不同类型的向量就是不同的向量场.混合检索就是在不同向量场上进行检索的.前面也提到过的bge-m3模型是既可以编码稀疏向量,也可以编码稠密向量.当然也还有其他嵌入(向量)模型.这里的稀疏向量和稠密向量就是不同的向量场.在这里就是顺带介绍一下混合检索的大致过程:先是对拿到的问题.编码成不同的向量场(可以是同一个向量模型,例如bge-m3).比如稀疏向量和稠密向量.然后在这两个向量场上分别去milvus向量库的相应向量字段上去计算相似度(例如使用BM25算法,使用统一的IP距离,如果是不同距离,结果应当转化)然后分别在不同的向量场上召回topk个语义最相关的语句.最后就是根据向量场上的权重的区别,选择混合检索方式(排序器)确定最后的排序结果.

http://www.jsqmd.com/news/1079631/

相关文章:

  • Spring 极简学习笔记(三)
  • 问题解决方法:win11电脑突然找不到wifi图标
  • STM32单片机STM32二维码/条码识别结算系统156-1(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码
  • GPT-4.5生产级接入:环境隔离、密钥管理与错误熔断实战
  • Pinecone混合搜索实战:稠密+稀疏向量工程落地指南
  • 大路灯哪个品牌好?好用靠谱的护眼大路灯推荐,不踩雷选购秘籍
  • 东莞大型工厂饭堂承包哪家优
  • 从此告别素材荒|2026年视频剪辑新手用什么AI工具制作视频素材盘点
  • 前沿技术借鉴研讨-2026.6.25(低生育/孕产妇心血管疾病)
  • 23-440、STM32智能PID无刷电机PWM调速正反转设计-1(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码
  • 2026年第五届算法、数据挖掘和信息技术国际会议(ADMIT 2026)
  • 前端实战测评:基于调用 Gemini 3.5,完整交互页面搭建全流程
  • 实测横评:图片去水印工具有哪些?12款工具从免费在线到手机电脑全打通
  • PCF80空间单细胞蛋白组:有效应对组织自发荧光挑战,保障多重空间蛋白组学检测质量
  • SQL注入绕过WAF实战:从原理到Payload构造的完整对抗指南
  • 巴西开闸,iOS 支付规则进入碎片化时代
  • 依托达秘搭建运营系统:从流量捕猎到精细化农耕,2026 TikTok运营终局拼的是体系
  • 为什么越来越多三甲医院,深度选用语音通信系统?
  • ios云手机稳控环境不卡顿 苹果云手机原生真机更安全
  • ROS 2 Tracing 原理
  • 稀疏多项式优化:基于树宽与状态提升的SLchord/SLpush方法解析
  • API到底是个啥玩意?一文讲透,小白也能看懂!
  • 场外个股期权可以买吗?普通投资者需要注意哪些风险
  • 【软工方法论21】UML建模工具与画图技巧
  • 洗后干燥怎么护理
  • 国产系统怎么选?四类人群精准指南
  • BERT语义建模检测钓鱼URL实战指南
  • Labview-计时器
  • 领域驱动设计实战:从问题域分析到清晰建模的完整指南
  • AI给80/90年代的人,带来了新的机会