当前位置: 首页 > news >正文

RAG召回质量优化:chunk分块大小踩坑记

先给结论:RAG 答不准,七成问题出在分块上,不在模型。我前后调了三周一个客服知识库,召回准确率从六成多爬到九成,真正动效果的就两件事——chunk 切多大,和切的边界在哪。

我一开始切错在哪

第一版我图省事,按固定 500 字硬切,不管语义,切到哪算哪。结果一段安装步骤被从第 3 步中间劈成两块,用户问"装到一半报错怎么办",召回回来的那一块只有第 4、5 步,前因全丢了,模型只能瞎接。

换成 1000 字大块,召回是全了,但又出新毛病:一块里塞了三个不相关的小标题,向量被稀释成一锅平均味,问得很具体时反而召不回来——因为这块的向量谁都不像。

我后来定的几条

  1. 按结构切,别按字数切。先用标题、空行、列表项这些天然边界断开,再在大段落里按字数兜底。这一步对带小标题的文档收益最大。

  2. chunk 控制在 300–500 字。我这套问答类知识库,400 字左右最稳;纯条款类(合同、政策)可以小到 200,一条一块。

  3. 重叠留 50–100 字。相邻块头尾叠一点,防止答案正好卡在切口上。代价是索引体积涨了约两成,但召回断头的情况基本没了。

一个反直觉的坑

我以为块越小越精准,于是切到 150 字试了一版,结果更差。块太碎,单块信息量不够,召回回来五六块拼在一起,模型还得自己重组逻辑,反而更容易拼错。后来才明白,块大小要跟你"一个问题通常需要多少上下文"对齐,不是越小越好。

还有个脏细节:中文别用按 token 的英文分块器默认参数,它对中文标点不敏感,我有一批 FAQ 被切在了顿号中间,"售前、售后、退换"被劈成"售前、售"和"后、退换",离谱。换成对中文友好的分隔符列表才好。

取舍

调分块是个体力活,没有一套参数通吃所有文档。我现在的做法是:新接一个知识库,先抽 20 条真实问题做召回测试,看召回片段是不是真包含答案,再回头调块大小。比盲调省事得多。

平台层面我用的是一个能直接配 RAG 知识库的智能体工具,分块策略它给了几档预设,省得我自己写切分脚本,但参数还得自己按文档调。

(底层模型我挂讯飞 MaaS,调现成 embedding 和对话 API,没自建算力,省下来的精力都花在调分块上了。)

http://www.jsqmd.com/news/1047380/

相关文章:

  • 从零到一:RTSP协议核心原理与实战交互全解析
  • 公寓床生产厂家选型指南:从资质到交付全维度解析 - 李lixpi
  • 魔兽争霸3终极优化指南:解锁高帧率与宽屏显示
  • 二七区卖黄金避坑实测,对比多家后才懂合扬无套路有多省心 - 奢侈品交易观察员
  • 闲置黄金怎么卖划算?厦门本地首选这家店 - 奢品小当家
  • 从渐变框到渐变线:CSS linear-gradient 核心原理深度解析
  • 2026东莞按大盘价收黄金,正规门店不扣损耗 - 名奢变现站
  • 动态主题建模中的异常值识别与前瞻信号分析
  • Qwen2.5-VL工业多模态微调实战:特殊行业数据适配指南
  • 术语俗话 --- DELETE Vs TRUNCATE Vs DROP
  • STM32 串口DMA+IDLE中断实战:高效数据帧接收与协议解析
  • 终极指南:如何用BetterNCM安装器一键增强网易云音乐体验 [特殊字符]
  • 【技术解码】- 电动汽车通信协议全景图:从车内CAN到车外交互
  • 2026 武汉本地正规瓷砖空鼓维修服务商盘点|无损免拆砖修复,全域上门售后有保障 - 宅安选房屋修缮
  • 术语俗话 --- 驱动/固件/软件
  • 滤袋企业推荐榜哪家强?最新10项维度实测 - 速递信息
  • 如何快速配置多显示器壁纸:Superpaper终极跨平台桌面美化指南
  • # 017 流式输出实现:实时生成与前端交互
  • 2026年GEO优化私有化部署公司权威测评 - 品牌报告
  • AI 时代云原生生态演进:K8S 社区 AI 方向、企业落地模式、平台工程与架构选型深度解析
  • 2026青岛高价回收名表店铺推荐,实报实收不套路 - 名奢变现站
  • Steam成就管理器完整指南:5分钟学会轻松管理游戏成就
  • 中原卖黄金避坑要点,实体店资质辨别教程合扬全程公开鉴价 - 奢侈品交易观察员
  • Windows系统文件MSVCP60D.DLL丢失找不到问题解决
  • 2024广州民办高中测评:择校避坑+靠谱排名指南 - 服务品牌热点
  • 2026 天津摄影学校排名,天津口碑好的摄影培训机构推荐 - 职业学校推荐官
  • Shell 与 Python 自动化运维:从重复操作到智能脚本的工程实践
  • xAI Grok 模型集成 Databricks Agent Bricks,企业数据驱动 AI 代理迎来新突破
  • 用什么方法把照片改为385*441像素?证件照规格调整经验 - 像素测评
  • 术语俗话 --- 微服务vs SOA vs 单体架构