当前位置: 首页 > news >正文

RAG 系列(十三):查询优化——让问题问得更好

问法不同,结果截然不同

向量检索有一个容易被忽视的脆弱性:同一个问题换个说法,检索结果可能完全不同。

“BGE 模型在中文上效果怎么样” 和 “中文 Embedding 推荐哪个” 语义高度相似,但它们的 embedding 向量在高维空间中的位置可能相差不少,导致检索到的文档集合差异很大。

这是 Bi-Encoder 的结构性问题:embedding 是在 query 和 doc互不知情的情况下各自计算的,对措辞的微妙变化非常敏感。

上一篇我们优化了文档侧——更好的分块策略让文档更容易被找到。本篇从问题侧入手:在把问题送进向量库之前,先对问题本身做一些处理,让它的召回效果更稳定、更全面。

三种策略:

  1. Multi-Query:生成多个问法,多角度检索后合并
  2. HyDE:先生成假设答案,用答案去检索
  3. Query Decomposition:把复杂问题拆成多个子问题

Multi-Query:多角度问法扩大召回面

核心思路

一个问题对应向量空间中的一个点,这个点可能恰好和某些相关文档距离较远。如果能从多个方向逼近,就能覆盖更大的区域。

原始问题 → LLM 改写 → [问法1, 问法2, 问法3] ↓ 分别检索,合并去重 ↓ 取前 TOP-K 返回

代码实现

fromlangchain_classic.retrieversimportMultiQueryRetriever MULTI_QUERY_PROMPT=ChatPromptTemplate.from_messages([("system","你是一个专业的问题改写助手。"),("human","请将以下问题改写为 3 个不同的表达方式,从不同角度提问,""以便在向量数据库中检索到更多相关内容。\n""每行输出一个问题,不要编号,不要解释。\n\n""原始问题:{question}"),])# 方式一:使用 LangChain 内置封装retriever=MultiQueryRetriever.from_llm(retriever=vectorstore.as_retriever(search_kwargs={"k":4}),llm=llm,)# 方式二:手动实现,可以控制 Prompt 和合并逻辑multi_query_chain=MULTI_QUERY_PROMPT|llm|StrOutputParser()variants_text=multi_query_chain.invoke({"question":question}
http://www.jsqmd.com/news/801839/

相关文章:

  • 如何基于Panda-Learning思想创建自己的自动化学习工具:完整指南
  • 生物物理学考研辅导班推荐:专门针对性培训机构评测 - michalwang
  • 使用taotoken聚合api后模型响应延迟与稳定性的实际体感
  • 2026年大连搬家公司选购避坑指南:从透明定价到企业级搬迁,宜邦搬家与同行深度横评 - 精选优质企业推荐官
  • LAMMPS实战:联合原子模型聚乙烯的拉伸失效与能量演化分析
  • 别再纠结选哪种了!一文看懂TOF、结构光、双目相机到底怎么选(附手机/机器人/AR场景对比)
  • 哔哩下载姬Downkyi:一站式B站视频下载与处理解决方案
  • 2026年大连搬家公司深度横评:从居民搬迁到企业搬厂的全场景选购指南 - 精选优质企业推荐官
  • 如何免费解锁城通网盘全速下载?ctfileGet城通解析工具终极指南
  • 解决方案:思源宋体CN TTF - 彻底解决中文排版字体选择难题
  • VichUploaderBundle最佳实践:10个技巧提升文件上传性能和安全性
  • Bebas Neue免费开源字体终极指南:从零开始掌握现代标题设计
  • 从NLP基础到LLM实战:手把手构建大模型全栈能力
  • 构建离散制造业的智能生产分析全框架
  • 政治学考研辅导班推荐:专门针对性培训机构评测 - michalwang
  • 如何让普通鼠标在Mac上获得超越触控板的体验:Mac Mouse Fix完全指南
  • 免费解锁Windows多用户远程桌面:RDP Wrapper终极配置指南
  • DOL-CHS-MODS整合包:打造专属游戏世界的完整指南
  • ESP8266自动下载电路时序逻辑与软件协同机制解析
  • WarcraftHelper 2024:魔兽争霸3终极优化指南
  • 保姆级教程:用Simulink复现异步电机恒压频比调速,从模型搭建到波形分析全流程
  • 如何高效解锁鸣潮120帧:WaveTools性能优化完全指南
  • 免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:公司只允许装签名应用 给察元AI打企业内部分发包
  • 2026年大连搬家公司深度横评与选购指南:从黑搬家乱象到透明服务标准化突围 - 精选优质企业推荐官
  • Arm嵌入式C/C++库优化与重定向实战
  • 从握手到突发:深入解析AXI总线协议的核心机制与实战应用
  • 中国少数民族史考研辅导班推荐:专门针对性培训机构评测 - michalwang
  • 一加9 Pro刷LineageOS 18.1保姆级教程:从解锁到GApps安装,附救砖指南
  • Gazebo插件配置避坑指南:为什么你的差速驱动机器人动不起来?
  • 终极游戏体验升级:DOL-CHS-MODS整合包完整指南