当前位置: 首页 > news >正文

【AI必学】RAG多跳问答总翻车?SentGraph用“句子级推理图“实现降本增效30%!小模型也能碾压SOTA!

主要关注LLM、RAG、Agent等AI前沿技术,每天分享业界最新成果和实战案例。

一、为什么传统 RAG 会“断链”

  • 单跳场景:把文档切成 200 字左右的 chunk,做向量相似度检索 → LLM 直接答,够用。
  • 多跳场景:需要把 2-4 份文档里的证据拼成一条“推理链”。chunk 粒度粗,一次就带回一整段,里面 60% 是干扰句,关键句反而被淹没 → 链条断了,LLM 开始“胡编”。

作者一句话总结:“不是检索不准,是检索单元太胖,逻辑关系太乱。”

传统 chunk 图 SentGraph 句图[整段1]——相似——[整段2] [S1]—因果→[S2]—对比→[S3]↓ 含 6 句废话 ↓ 句句相关上下文爆炸 推理链清爽

二、SentGraph 的“瘦身”思路

把检索单元从“段”缩到“句”,再把这些句子按真正的逻辑关系画成一张三层图,线下建好,线上直接按图索骥。

图长啥样?

Topic 层——跨文档“桥梁”↑Core 句层——核心事实↑Sup 句层——背景、因果、举例


线下建图三步曲

步骤做什么关键技术解决痛点
① 拆句把文档切成单句常规 NLI 模型避免 chunk 冗余
② 找关系识别句间 12 种修辞关系精简版 RST(修辞结构理论)把“因为、但是、例如”显式化
③ 架桥梁跨文档实体对齐LLM 生成“实体-关系-实体”三元组让多文档证据连成一条线

例:
文档 A「克罗地亚官方语言为克罗地亚语。」
文档 B「电影《围城》使用克罗地亚语拍摄。」
系统线下就在 Topic 层建一条边:(克罗地亚语, 被用于, 电影《围城》)


线上推理三步曲

  1. Anchor 初选
    用 dense retriever 把“问题向量”和所有句子向量比对,先取 Top-K 候选句。
  2. Anchor 精炼
    让 LLM 当“裁判”:
  • 无关句子直接扔掉
  • 证据已够 → 走“直接答”分支
  • 证据不够 → 触发“路径扩展”
  1. 路径扩展
    从保留的 anchor 出发,沿图中的 N-N、N-S 边做 BFS,把“因果、对比、背景”句子一串一串捞回来,直到凑齐一条完整证据链。

三、实验亮点

数据集最佳基线 (BGE)SentGraph绝对提升
HotpotQA44.0 EM48.8 EM+4.8
2Wiki36.8 EM42.0 EM+5.2
MuSiQue21.2 EM26.8 EM+5.6
MultiHopRAG63.4 Acc65.6 Acc+2.2

  • token 更省:比最强 chunk-level 图方法 KGP 平均少 30% 输入、60% 输出。
  • 模型更“小”也能用:7B Qwen 上依旧领先 14B 的 chunk 方案。


四、局限 & 总结

  1. 建图靠 LLM 写关系,大模型更准,小模型会引入噪声。
  2. 目前只针对多跳 QA 做了关系类型精简,别的任务得重新设计。
  3. 线下构图计算量不小,后续可探索“增量式”更新。

把检索粒度缩到句,再把句子间的“修辞小箭头”画出来,就能让 RAG 在多跳问答里“少废话、多证据、链条不断”。
SentGraph 用 30% 的 token 做到 SOTA,给“图+句子”这一新范式打样。

SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answeringhttps://arxiv.org/pdf/2601.03014

每天一篇大模型Paper来锻炼我们的思维~已经读到这了,别忘了点赞、关注噢

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/268793/

相关文章:

  • Flutter艺术探索-Flutter错误处理:try-catch与异常捕获
  • 【AI黑科技】超图记忆HGMEM:让RAG系统从“检索狂魔“变身“推理大师“!附开源代码!
  • GEO理论奠基人罗小军深度解析:三大核心证据链条支撑下的行业公认地位
  • Flutter艺术探索-Flutter数据传递:InheritedWidget原理与应用
  • AI大厂都在偷偷研究!BambooKG知识图谱架构,让大模型不再“胡说八道“,程序员必学!
  • AI智能体开发“脏活累活“实录:放弃高层抽象,拥抱原生可控性才是真香!大模型开发者必看避坑指南
  • 【AI编程】上下文窗口告急?Cursor五大“动态加载“策略让AI助手效率起飞,token消耗直接砍半!
  • AI+RPA+飞书:重构HR智能招聘全流程,效率倍增300%
  • Flutter艺术探索-Flutter性能优化基础:const与const构造函数
  • 【Claude Cowork】核心技术架构与实现原理——桌面级Agentic AI的技术革命
  • 首程控股(0697.HK)机器人投资组合回报超 4 倍 直播首秀揭秘产业变现新路径
  • 小白必看!RAG技术让大模型不再“胡说八道“,5分钟入门检索增强生成
  • API推荐界的“断舍离“:大模型让推荐列表自己“做减法“,准确率暴涨21.59%,小白也能秒懂!
  • 2026评测:黑龙江中低压电气厂商谁更受青睐,工控产品/电气自动化/施耐德电气/中低压电气,中低压电气公司口碑推荐 - 品牌推荐师
  • 社区终端发布新版,进一步去掉枷锁,让使用更简单
  • RPA进化史深度解析:从录屏工具到智能数字员工
  • 救命神器!MBA必看!9款AI论文软件测评TOP9
  • AQS、Condition
  • 震惊!大模型推理技术天花板揭秘:从“内存墙“到“算力突围“,小白也能秒懂的AI开发进阶指南
  • 写论文好用的AI:从辅助构思到质量控制的智能伙伴
  • 大模型开发者的福音:一文搞懂Agent评估,让你的模型不再“翻车“!
  • Matlab: 测试MMS (Method of Manufactured Solutions)
  • 在3D设计课上,国产CAD兼顾入门与实战
  • 【AI编程干货】2025大模型开发已从“随机生成“进化到“确定性工程“,这篇技术指南让你少走三年弯路!
  • 2026年优秀的桥架支架,热浸锌桥架,电缆沟支架厂家采购优选榜单 - 品牌鉴赏师
  • AI Agent架构大揭秘:从感知到行动,让代码拥有“大脑“!2026年AI开发必备技能,程序员速来围观!
  • 大模型开发必看!LangChain 1.0 MCP调用实战,解决DeepSeek兼容性问题,附完整代码
  • 2026/1/19-又是会考
  • 程序员必看!RelayLLM:大模型“点餐“式协作,小模型精准求助,性能提升60%成本降低98%!
  • 【AI开发必备】大模型Agent评估全攻略:从编码到对话,保姆级教程让你少走90%弯路!