当前位置: 首页 > news >正文

RAG技术

目录

  • 一、RAG概述
  • 二、RAG流程
    • 1.构建向量数据库:
    • 2.Prompt增强:

一、RAG概述

LLM基于互联网上海量的信息进行训练,以知识的广度为主、且具有滞后性。但是对于专业性极强的问题或最新的消息,因为训练时并没有使用专门的数据来训练,LLM输出结果并不会很理想,甚至会出现模型幻觉。

RAG出现之前用户只能基于Context记忆向模型输入一些前置知识,使得模型能够回答特定问题,但如果Context太长,由于Encoder无法提取超长时间序列特征,此时Encoder会遗忘部分特征。

RAG的思路是将大量的知识保存到向量数据库,每次提问首先查询数据库得到相关相关的token块,拼接Context、token块、本次提问作为Transformer的输入。(不要妄想重新训练LLM,money扛不住)

二、RAG流程

  • 构建向量数据库:分片->索引
  • Prompt增强:召回->重排->生成

1.构建向量数据库:

  • 分片:TokenSplitter查vocab表将文本转为token序列,然后对token序列进行分片,拆分为多个token块。
  • 索引:通过Embedding模型(text-embedding-3-small)将token块转换为向量,将<行唯一ID,向量,token块>作为键值对存入向量数据库

2.Prompt增强:

  • 召回:用户输入文本经过分片索引转为向量,查询向量数据库基于相似度获取一批与用户文本相似度最高的向量,获取其对应的token块
    • 余弦相似度:计算两个向量夹角的cos值,夹角越小相似度越高。
    • 欧氏距离,计算两个向量终点之间的距离,距离越小相似度越高。
    • 点积:计算向量1在向量2上的投影长度与向量2长度的乘积,点击越大相似度越高。
  • 重排:从召回的token块中使用cross-encoder模型精筛出部分相似度高的块,重排相似度准确率更高,但是耗时长,因此不适用于直接操作整个向量数据库。
  • 生成:将用户输入token+token块拼接为Prompt,然后使用LLM的Embedding模型(这里的Embedding是LLM内部的,而索引阶段的Embedding模型是用于构建向量数据库的)将每个token转为向量,最后将矩阵输入模型,得到结果。

http://www.jsqmd.com/news/544953/

相关文章:

  • 告别B站千篇一律界面:BewlyBewly焕新定制方案提升浏览效率
  • OpenClaw 部署指南 (Linux)版本原始安装。
  • 如何通过Vial-QMK打造专属键盘体验:从入门到精通的个性化定制指南
  • MCP(Model Context Protocol):AI 应用的“USB-C 接口”
  • BDInfo:蓝光媒体技术解析的专业级引擎
  • 数据不出域,决策在边缘:2026年船舶专用边缘计算盒子推荐 - 品牌2026
  • TestDisk与PhotoRec技术架构深度解析:480+文件格式恢复机制与磁盘修复原理剖析
  • Windows风扇控制终极指南:用FanControl打造安静高效的电脑散热系统
  • 10分钟搭建企业级人脸识别系统:CompreFace零代码实战指南
  • 鸿蒙 HarmonyOS 4.0+ 音乐播放器企业级完整实现(后台播放 + 系统播控中心 + 全功能)
  • YimMenu功能增强指南:GTA V游戏体验优化实现方案
  • DXVK如何为老旧系统注入现代图形处理能力?
  • OpenClaw配置优化:GLM-4.7-Flash长文本处理性能提升30%
  • 基于ESP32与OneNET的微信小程序环境监测系统实战
  • 俄罗斯商品“通关密码”:诚信标签KIZ
  • 别再用串口打印了!用STM32F407驱动0.96寸OLED做个实时系统状态监视器(附源码)
  • 解决AOSP工程Android Studio打开卡顿
  • OpenCore Auxiliary Tools (OCAT):掌握黑苹果配置的终极图形化工具
  • OpenClaw与数字员工研究报告:从个人助理到企业数字员工的演进路径
  • CosyVoice多语言语音合成实测:支持中英日韩,一键生成多国语音
  • 如何永久保存微信聊天记录:WeChatMsg的完整数据备份指南
  • 告别手动配置:用快马一键生成vmware虚拟机ubuntu自动化安装脚本
  • 杭州茅台酒回收避坑指南:2026年必看,拒绝被骗、拒绝压价
  • 避坑指南:Docker部署OnlyOffice时,字体、协作人数和WPS支持的三大难题怎么破?
  • 精选深度测评|2025年AI编程工具权威推荐:8大主流AI 编程工具深度对比与选型指南
  • 探秘Windows系统底层:解锁系统内核的7个核心工具集
  • OpenClaw(小龙虾)接入微信的功能实现——中文版
  • NaViL-9B低代码集成方案:通过HTTP API快速接入现有业务系统
  • CoPaw数据库智能查询实战:用自然语言生成高效SQL语句
  • 本地部署 OpenClaw + Ollama + DeepSeek 完整指南