当前位置: 首页 > news >正文

数据|非rag的类人检索

万物皆数据结构

还是根据应用场景的平衡抉择问题


Claude Code 创始人:我们放弃了向量 RAG

Claude Code 创始人 Boris Cherny 在 X 上分享:Claude Code 的早期版本曾采用 RAG + 向量数据库 来做代码检索

但很快发现 agentic search(智能体式检索) 在实际使用中更好用。原因包括:实现更简单、隐私与安全风险更低、无需处理索引过期问题,以及整体可靠性更高。

在代码场景中,数据相对结构化、搜索空间更小,因此 agentic search 更自然、更稳定。

在文档场景中,PageIndex 也独立采用了类似的思路。一种无需向量数据库、由推理驱动的 RAG 与 Agent 检索 Infra:通过模仿人类阅读过程,构建目录式的树索引,让 LLM 进行上下文推理式检索。无需向量数据库、无需切块,也能实现高精度、可追溯、可解释的长文档问答与 Agent 任务。


github readme↓ 挺好的宣发思路

传统向量RAG依赖语义相似度检索,存在三大痛点

问题与答案未必文字相关

分块导致上下文断裂

难以处理多层引用。

PageIndex提出的基于推理RAG采用人类式检索逻辑——先建立文档树状索引(类似目录结构),再通过递归推理逐层深入查找,如同人在图书馆按分类找书。

这种方法在FinanceBench测试中准确率达98.7%,特别适合处理财报、法律文书等专业长文档,实现真正基于相关性的精准检索。

http://www.jsqmd.com/news/463438/

相关文章:

  • Java团队转型AI应用开发:挑战与JBoltAI的破局之道
  • 打卡信奥刷题(2939)用C++实现信奥题 P5810 [SCOI2004] 文本的输入
  • 化学绘图效率革命:InDraw五大核心功能全解析,从OCR识别到CAS号检索的实战指南
  • JBoltAI视频SOP:让“工业+AI”更高效直观
  • Python爬虫实战:监控贝壳找房小区均价与挂牌增量!
  • 物联网毕业设计效率提升指南:基于STM32原理图的模块化设计与快速验证方法
  • Spring Boot WebClient性能比RestTemplate高?看完秒懂!
  • 打卡信奥刷题(2940)用C++实现信奥题 P5815 [CQOI2010] 扑克牌
  • MTools教育应用:智能批改系统开发实战
  • 次元画室生成网络拓扑图:运维与网络教学的AI助手
  • 1.9 电子商城核心链路质量保障:从下单到支付的测试实战拆解
  • 使用IDEA开发RVC模型Java调用客户端:工程化配置与调试技巧
  • Leaflet与turf.js实战:动态生成等值线图并实现精准值交互展示
  • ArcGIS坐标系实战:从基础概念到投影变换全解析
  • Clawdbot汉化版企业微信实战:消息模板开发、事件回调处理、菜单集成
  • QGC地面站集成NTRIP网络差分:从原理到稳定配置实战
  • DDD分层架构的实践指南:从理论到落地
  • SwAV:在线聚类与对比学习的融合——无监督视觉表征学习新范式
  • 嵌入式系统多协议融合实战:从IIC温湿度采集到CAN总线通信的完整链路解析
  • OpenStack实战:从零搭建私有云平台
  • 从零到一:基于Cloudreve构建企业级私有云存储平台
  • 墨语灵犀GPU算力适配:华为昇腾910B+MindSpore框架移植全流程详解
  • 【密码学】从MD5到SM3:哈希函数演进与实战应用解析
  • Tao-8k前端交互应用:集成微信小程序的AI对话功能开发
  • 思科路由器实战:show ip route命令解析与路由表高效排查技巧
  • 渗透测试利器:悬剑5武器库实战部署与工具集深度解析
  • 青岛装协推荐装修公司排行榜_正规资质榜单 - GEO排行榜
  • ThinkPHP部署遇阻:深入解析open_basedir限制及跨目录访问解决方案
  • 安卓13+Termux进阶玩法:用FakeRoot模拟root环境测试渗透工具
  • 精准备考:为主治医师挑选合适题库 - 医考机构品牌测评专家