当前位置: 首页 > news >正文

RAG-day2

一、文本分块

  1. 作用:长文档不能直接喂给大模型,必须切成小块,避免超出上下文限制、检索更精准。
  2. 常见分块方式:固定大小分块、按段落分块、按语义分块。
  3. 分块原则:块不能太大(冗余多)、不能太小(语义不完整)。

二、向量化与嵌入模型

  1. 嵌入模型(Embedding 模型):专门负责把文本转成向量的模型。
  2. 特点:语义越相似的文本,转化后的向量数值越接近。
  3. 作用:是语义检索的基础,没有向量化就做不了语义匹配。

三、向量数据库

  1. 定义:专门用来存储向量、快速做相似度检索的数据库。
  2. 和普通数据库区别:普通库适合精确匹配;向量库适合语义相似度匹配
  3. 常见用途:存放文档块向量、用户问题向量,供 RAG 快速检索。

四、RAG 细化完整链路(含隐藏子步骤)

文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库(存向量数据库)→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 + 用户提示词→ 大模型增强生成答案

五、语义检索核心逻辑

  1. 用户问题 → 转向量
  2. 和向量库里所有文档块向量算相似度
  3. 取出相似度最高的 Top-N 片段
  4. 作为参考资料给大模型
http://www.jsqmd.com/news/775471/

相关文章:

  • 提示词工程day2-day4
  • 3分钟掌握ncmdump:让你的网易云音乐在任意设备自由播放
  • 告别兼容性烦恼:ViGEmBus虚拟手柄驱动让Windows游戏体验全面升级
  • AI驱动的认知行为疗法实践:用cbt-llm-kit构建结构化情绪管理工具
  • AI+水文水资源实战:攻克非平稳序列预测、CMIP6降尺度、SWAT/EFDC/VIC模型自动化率定、启发式强化学习多目标优化(NSGA/MOEA/D)难关
  • 第十九篇:《视觉回归测试:让UI自动化检测样式异常》
  • 三步解锁原神帧率限制:从卡顿到流畅的完整技术指南
  • 解锁硬件潜能:Universal x86 Tuning Utility全面评测与使用指南
  • XUnity.AutoTranslator:10分钟掌握Unity游戏实时翻译的完整指南
  • 桌面AI工具集成平台cc-switch:原理、配置与效率提升实践
  • DoL-Lyra智能整合包:3分钟获得完整游戏美化体验的终极指南
  • 基于MCP协议实现AI助手与Amazing Marvin任务管理系统的无缝集成
  • JetBrains IDE试用期重置终极指南:2026年开源解决方案详解
  • ShareGPT4V:用高质量数据提升多模态大模型视觉理解能力
  • OnmyojiAutoScript:阴阳师自动化脚本终极指南,20+任务智能托管解放双手
  • 从代码片段到上下文理解:构建自动化代码分析工具的设计与实践
  • 3步技术实现:深度解析Blender 3DM导入插件的架构设计与应用方案
  • 规范驱动开发:基于OpenAPI的API设计先行实践指南
  • 解锁Windows 10的Android生态:WSA-Windows-10移植项目完全指南
  • 校园场景下 USB 诱饵攻击机理分析与安全防御体系研究
  • FPGA实现NFC读卡器:从射频电路到协议栈的硬核开发指南
  • Taotoken的按token计费模式让实验性项目成本可预测
  • 算法基础(六)—— 大 O、Ω、Θ如何描述算法增长边界
  • 矢量网络分析仪维修全攻略:常见故障与排查方法科普
  • 观测ubuntu服务器调用taotoken api的延迟与token消耗情况
  • 使用OpenClaw Agent工具时如何配置Taotoken作为其模型供应商
  • AI编程助手技能测试框架skillprobe:从概率性到工程化的实践指南
  • 基于口碑数据的词云生成器:从中文分词到情感可视化的完整实践
  • NVIDIA Profile Inspector实战指南:深度优化显卡性能与游戏体验
  • 华硕笔记本终极性能控制指南:用G-Helper轻松解锁完整潜能