当前位置: 首页 > news >正文

6.3 检索优化三板斧:查询改写、分块策略、召回率优化实战

检索优化三板斧:查询改写、分块策略、召回率优化实战

查询改写、分块、召回优化,让 RAG 检索更准更全。本节基于《AI工程》第6章「RAG and Agents」— Retrieval Optimization:查询改写、分块策略、向量数据库选型、召回率优化。

一、检索为何需要优化?

Chip Huyen 在《AI工程》第6章将检索优化列为 RAG 的重要环节。默认配置下,RAG 常出现:检索不到检索不准检索到无关内容。书中指出,检索质量直接影响生成质量,是 RAG 的瓶颈之一。本节从查询改写分块策略召回优化三方面,系统提升检索质量。


二、第一板斧:查询改写

2.1 问题

《AI工程》指出,用户查询往往简短、口语化,与文档表述不一致,导致向量匹配差。例如用户问「怎么退钱」,文档可能写「退款流程」,语义相近但用词不同。

2.2 方法

方法说明
扩展用 LLM 扩展为多个相关查询
改写转为更书面、更贴近文档的表述
多 query生成多个变体,分别检索后合并

2.3 代码示例

defquery_expansion(original_query:str,llm)->list:"""查询扩展(对应书中查询改写)"""prompt=f""" 基于以下用户问题,生成 2-3 个不同表述的检索用查询,保持原意。 用户问题:{original_query}每行一个查询。 """response=llm.generate(prompt)queries=[q.strip()forqinresponse.strip().split("\n")ifq.strip()]return[original_query]+queriesdefmulti_query_retrieve(queries:list,retriever,top_k_per_query:int=3):"""多 query 检索合并"""all_docs=[]forqinqueries:docs=retriever.get_relevant_documents(q)[:top_k_per_query]all_docs.extend(docs)returndeduplicate_by_content(all_docs)[:top_k_per_query*2]

三、第二板斧:分块策略

3.1 问题

书中强调,分块策略影响检索质量。块太大:噪声多;块太小:上下文不足。需根据文档类型与任务特点选择。

3.2 策略对比

策略chunk_sizeoverlap适用
固定长度50050通用
按段落按 \n\n0自然段落
按语义语义边界灵活高质量
滑动窗口200100小文档

3.3 代码示例</

http://www.jsqmd.com/news/407364/

相关文章:

  • FaceRecon-3D在医疗美容领域的3D人脸重建应用
  • BEYOND REALITY Z-Image在建筑可视化中的应用:概念设计快速呈现
  • deepseek能做广告吗?deepseek推广公司大全 - 品牌2025
  • 6.2 向量检索vs关键词检索:混合检索与重排序实战对比
  • 超轻量级AI助手nanobot实测:比传统方案小99%的秘密
  • 2026成都二手空调/中央空调厂家推荐金锋伟业,专业制冷设备翻新与安装! - 品牌企业推荐师(官方)
  • Qwen3-ASR-1.7B语音转文字:GPU加速的高效解决方案
  • 2026年隔油池清掏公司权威推荐:地下室化粪池清掏公司、学校化粪池清掏、小区化粪池清理、小区隔油池清理选择指南 - 优质品牌商家
  • 6.1 RAG架构全流程:从文档加载到生成的完整实现
  • x402 协议深度解析:用一个 HTTP 状态码,重建互联网的支付层
  • 2026 覆膜板与小红板采购指南:五大实力厂家精准匹配,千洛木业领衔全场景适配 - 深度智识库
  • Qwen3-ASR系统管理指南:服务启停与日志查看技巧
  • 原来携程任我行卡回收可以这么简单 - 京回收小程序
  • 分期乐购物额度如何安全变现?正规流程与避坑全指南 - 团团收购物卡回收
  • 2026靠谱GEO服务商推荐|避坑指南+实测榜单,AI流量争夺战必看! - 品牌测评鉴赏家
  • 天虹提货券回收攻略来袭,轻松变“闲”为“现”焕新生 - 京回收小程序
  • 【2026最新】HWiNFO下载安装全攻略:专业硬件检测工具完整使用指南(附安装包) - sdfsafafa
  • XState解释器深度解析
  • Anthropic 2026 智能体编程趋势报告:软件开发大变革正式到来
  • 别亏了!年后瑞祥商联卡闲置,这些隐性亏损要避开 - 团团收购物卡回收
  • PDF-Extract-Kit-1.0开源可部署价值:PDF解析能力嵌入自有业务系统指南
  • 2026温湿度/快速温变/高低温/氙灯老化试验箱厂家推荐无锡鼎力测控,精准可靠,为研发质检护航 - 品牌企业推荐师(官方)
  • 真心不骗你 8个降AIGC平台测评:本科生降AI率必备工具推荐
  • Git-RSCLIP模型在教育培训领域的应用
  • 2026广告亮化/设计制作/安装厂家推荐漯河力天,创意点亮品牌,专业服务全程无忧 - 品牌企业推荐师(官方)
  • 2026年智能调节阀厂家最新推荐:高频耐磨球阀、黑灰水球阀、三通调节阀、上下展式放料阀、偏心旋转阀、多通径球阀选择指南 - 优质品牌商家
  • 【GitHub项目推荐--APIAuto:机器学习驱动的零代码HTTP接口智能测试与开发平台】⭐⭐⭐
  • 微纳结构与界面热输运的多尺度模拟
  • 2026年化粪池清掏厂家推荐:小区隔油池清理/工业隔油池清理/工厂化粪池清掏/工厂隔油池清掏/选择指南 - 优质品牌商家
  • A2A 协议深度解析:让所有 AI Agent 说同一种语言