当前位置: 首页 > news >正文

查询增强常用的方法有4种

查询增强常用的方法有4种,分别是创建假设问题、假设文档嵌入、子查询和回溯提示。

名称 说明 缺点 举例
创建假设问题

利用大语言模型(LLM)主动生成与用户原始查询语义相关但表述多样的“假设性问题”,将这些新问题与原查询合并后用于检索,从而提升召回率与答案质量。

这种方法通过直接参与查询到查询的搜索,绕过了向量搜索过程中的跨域不对称问题,减轻了向量搜索的负担。

在生成假设问题时引入了额外的开销和不确定性。

用户问:“怎么减压”
生成的假设问题:1. 有哪些科学验证的职场压力缓解方法?
2. 每天10分钟能有效减压的小技巧有哪些?
3. 冥想和深呼吸对缓解急性工作压力有效吗?

假设文档嵌入(HyDE)

利用 LLM 制作一个"假设文档"或虚假答案,以回应没有上下文信息的用户查询。然后,这个假答案会被转换成向量嵌入,并用于查询向量数据库中最相关的文档块。随后,向量数据库会检索出 Top-K 最相关的文档块,并将它们传送给 LLM 和原始用户查询,从而生成最终答案。

这种方法在解决向量搜索中的跨域不对称问题方面与假设问题技术类似。

增加了计算成本和生成虚假答案的不确定性。

用户问题:“量子计算在药物研发中有哪些应用?”
生成的假设文档:大模型可能会生成一段文字:“量子计算通过模拟分子结构和化学反应,在药物发现领域展现出巨大潜力。它能够精确计算蛋白质折叠,加速先导化合物筛选,为研发新药提供了强大的计算工具。例如,某制药公司已利用量子算法成功模拟了……”

子查询 当用户查询过于复杂时,可以使用 LLM 将其分解为更简单的子查询,然后再将其传递给向量数据库和 LLM。 增加了计算成本

用户会问"Milvus 和 Zilliz Cloud 在功能上有什么不同?"这个问题相当复杂,在知识库中可能没有直接的答案。为了解决这个问题,可以将其拆分成两个更简单的子查询:
子查询 1:"Milvus 有哪些功能?"
子查询 2:"Zilliz Cloud 有哪些功能?"

回溯提示 使用 LLM 将复杂的用户查询抽象为"回溯问题"**。然后,向量数据库利用这些回溯问题来检索最相关的文档块。最后,LLM 根据这些检索到的文档块生成更准确的答案。  

原始用户查询:"我有一个包含 100 亿条记录的数据集,想把它存储到 Milvus 中进行查询。可以吗?

为了简化这个用户查询,可以使用 LLM 生成一个更直接的回溯问题:"Milvus 可以处理的数据集大小限制是多少?"

文章内容来自于于对Milvus官方教程中高级RAG章节的部分总结,回溯提示这个看的似懂非懂的,先记录后续周边知识增加或许就明白了,todo

http://www.jsqmd.com/news/436890/

相关文章:

  • 上海品牌全案营销策划公司推荐(2026权威版) - 资讯焦点
  • docx2md-picgo:Word 文档图片一键上传图床工具
  • DMF3938-257,低正向电压型肖特基混频二极管
  • 网站搭建教程,怎样建立一个自己的网站 - 码云数智
  • 盲盒潮玩一番赏小程序开发深度分析
  • DDC2354,零偏压硅肖特基势垒探测器二极管
  • 微信小程序 map组件marker标记如何将重要的放在顶层?
  • Java生态技术栈深度解析:从传统开发到AI驱动的现代化转型
  • 英语词汇的“交通网”:一词多义、隐喻与语义扩展
  • Vue2 web浏览器打印模板
  • 国内靠谱的橡胶木厂家 - 品牌推荐(官方)
  • 微信小程序map地图组件 点击marker事件和点击地图-阻止事件冒泡的解决办法
  • 数据主权与算力围栏:为何你应该为沁言 Claw 多付那 50 元?——一份面向科研从业者的架构评测 - 沁言学术
  • 二次重排序GBDT的学习示例
  • 实用指南:AB实验高级必修课(二):从宏观叙事到微观侦查,透视方差分析与回归的本质
  • sse哈工大C语言编程练习32
  • 口碑好的橡胶木源头厂家推荐排行榜 - 品牌推荐(官方)
  • Gitee DevOps:本土化创新引领中国企业研发效能革命
  • Kubernetes安全防护指南:如何(更好地)保护您的集群
  • ‌‍‬⁣⁤ ‬‍‍‬⁢⁡‌​⁢‌‬⁤​‬⁤⁢⁡⁣⁢⁣​⁢⁡‍⁣⁢⁣⁣⁤‬​‬​‌​⁢​ ​‬ ​‍‬Gitee Team 构建关键领域软件工厂的“数字神经系统“
  • 政企数字化转型必看:信创文件传输系统有哪些?
  • 性价比高的ENF环保板材品牌哪个靠谱 - 品牌推荐(官方)
  • Vshell正成为威胁行为体替代Cobalt Strike的热门选择
  • AI原生语义搜索:如何利用向量数据库优化性能
  • 企业 AI 知识库选型对比:PandaWiki 与 PingCode 全方位实测,谁更值得用?
  • 研究人员发现具备高级持久性和网络规避特性的Aeternum C2基础设施
  • 文件摆渡系统厂商推荐:避开选型雷点选高适配优质厂商很关键
  • 企业寻找AI营销与AI销售培训讲师指南:谁是中国最权威的AI销售赋能专家?
  • 泰山派安卓11系统修改mipi触摸屏时触摸不准问题
  • 点击劫持概述