当前位置: 首页 > news >正文

前沿模型系列(三)《检索增强的语言模型》

目录

语言模型基础

1. 语言模型分类:

2. 评价指标:

3. 典型结构:

RAG 技术概述

1. RAG 提出背景:

2. RAG 基本原理:

3. 检索范式

RAG 早期经典工作

1. REALM:

2. Retrieval-in-context LM

3. RETRO

4. kNN-LM

5. 对比

RAG 技术发展

1. 发展阶段:

2. 核心共识:

RAG 最新研究进展

1. 检索过程优化:

2. 知识有效利用:

UltraRAG 开源项目介绍

总结


本文由九格大模型团队讲述 RAG 技术相关基础知识、技术发展历程以及最新研究进展。

语言模型基础

1. 语言模型分类:

  • • 自回归语言模型:GPT、千问等

  • • 掩码语言模型:BERT

2. 评价指标:

困惑度(Perplexity)

3. 典型结构:

  • • Encoder-Decoder 架构

  • • Encoder-only

  • • Decoder-only 的区别

RAG 技术概述

1. RAG 提出背景:

  • • 预训练模型的局限性:知识密集型场景、时效性信息、幻觉问题

2. RAG 基本原理:

  • • 外部信息以平文本形式存在,通过检索增强模型生成能力

  • • 基础范式:用户 Query → 检索知识库 → 检索信息与 Query 结合 → 模型生成回答

3. 检索范式

RAG 早期经典工作

1. REALM:

  • • 掩码模型,检索相关片段拼接后预测

  • • 检索模型训练:

    • • 单塔与双塔模型原理

    • • 对比学习训练 Embedding 模型

  • • 检索后处理:多次推理与概率平均

  • • 后续工作:DPR、RAG、Atlas 等面向开放域问答任务

2. Retrieval-in-context LM

  • 顺序预测模型

  • 检索对象选择:

    • • 查询语句长度与噪声问题

    • • 实验分析:查询语句长度对检索效果的影响

  • 检索频率优化:

    • • 提高检索频率对模型性能的影响

    • • 计算量与检索成本的平衡

  • 召回文本数量影响:

    • • 召回数量与模型性能的关系

    • • 噪声引入与性能下降问题

3. RETRO

4. kNN-LM

5. 对比

RAG 技术发展

1. 发展阶段:

  • • 2022年:建立 RAG 基本范式

  • • 2023年:关注检索时机与方式优化

  • • 近期:结合思维链(CoT)、多模态知识注入

2. 核心共识:

  • • 基于 Embedding 模型的 Dense Retrieve 成为标配

  • • 输入范式:输入层直接拼接文本

RAG 最新研究进展

1. 检索过程优化:

  • 多轮检索(难以避免噪声问题)与自适应检索(信息割裂,缺少交互整合)

  • • 引入大模型笔记概念:记录检索信息、规划检索过程、减少噪声

2. 知识有效利用:

  • • 指令跟随能力在知识密集场景下的局限性

  • • 强化训练方法:DPO、GRPO 等

  • • RAG-DDR:基于 DPO 的生成链路强化调优

    • • 后向对齐策略:模块化训练与采样调节

UltraRAG 开源项目介绍

总结

本文讲解了 RAG 技术原理、技术面临的挑战与解决方案,RAG 发展历程与最新研究进展。

http://www.jsqmd.com/news/495309/

相关文章:

  • BPF 辅助函数注册
  • java毕业设计基于springboot+Java兰州市出租车服务管理系统
  • 2026年南京口碑好的纸箱定制定制生产排名,推荐的纸箱定制厂商有哪些 - 工业品网
  • 闭眼入! 更贴合开源免费需求的降AI率网站,千笔·降AIGC助手 VS 万方智搜AI
  • 极简Prometheus监控实战指南
  • 2026年 挂具厂家推荐排行榜:氧化挂具/喷涂挂具/电镀挂具/涂装挂具/钛合金挂具,专业定制与耐用品质深度解析 - 品牌企业推荐师(官方)
  • 2026年 钢筋桁架焊接机厂家推荐排行榜,全自动钢筋网焊接机,桥梁钢筋网焊接机,预制构件钢筋网焊接机,精准高效焊接设备深度解析 - 品牌企业推荐师(官方)
  • 〘 8-2 〙软考高项 | 第15章:项目风险管理(下)
  • 高性价比AI写教材指南:低查重且高效的操作技巧分享
  • 网站增加可允许上传文件类型,例如webp、mov等文件格式扩展
  • 打印机共享、连接
  • 2026年闭眼入!万众偏爱的降AIGC平台 —— 千笔
  • IT 卷不动了?转网安才是真香!零网安基础入门到精通,收藏这篇就够了!
  • 计算机视觉中的多模态融合:技术原理与工业实践
  • 基于语音识别的智能家居设计(有完整资料)
  • 2026年选购优质轻集料混凝土批发厂商的实用攻略,目前轻集料混凝土厂商嘉贤诚信务实提供高性价比服务 - 品牌推荐师
  • 计算机毕业设计之springboot毕业生学历证明系统
  • 请问PBOOTCMS网站安装后,首页打开 404 NOT FOUND的处理方式是怎么回事
  • 2026年3月市场口碑好的危废暂存间公司都在这份分析分析里,危废间/防爆危废间/危废暂存间,危废暂存间实力厂家推荐 - 品牌推荐师
  • SpringBoot实现各种参数校验,写得太好了,建议收藏!
  • AI时代岗位发展前景
  • 全球半导体及集成电路博览会攻略:新手参展不踩坑,高效对接资源 - 品牌2025
  • IF 开环启动切龙伯格观测器 Matlab/simulink 仿真探索
  • 2026年期货量化软件扩展性排名_二次开发能力对比
  • 【数据结构与算法】死磕排序算法:面试官最爱问的那些排序(下篇)
  • 2026年质量好的铠装控制电缆工厂推荐:护套控制电缆/阻燃屏蔽控制电缆稳定供应商推荐 - 行业平台推荐
  • 瑞祥商联卡回收攻略:快速变现的秘密都在这里! - 团团收购物卡回收
  • 【开题答辩全过程】以 基于python 的图书借阅管理系统为例,包含答辩的问题和答案
  • 城市内涝预警系统怎么做?城市内涝积水监测技术解析
  • [网络安全提高篇] 一二三.恶意样本分类之基于API序列和深度学习的恶意家族分类详解