当前位置：首页 > news >正文

RAG-day2

news 2026/7/13 3:40:14

一、文本分块

作用：长文档不能直接喂给大模型，必须切成小块，避免超出上下文限制、检索更精准。
常见分块方式：固定大小分块、按段落分块、按语义分块。
分块原则：块不能太大（冗余多）、不能太小（语义不完整）。

二、向量化与嵌入模型

嵌入模型（Embedding 模型）：专门负责把文本转成向量的模型。
特点：语义越相似的文本，转化后的向量数值越接近。
作用：是语义检索的基础，没有向量化就做不了语义匹配。

三、向量数据库

定义：专门用来存储向量、快速做相似度检索的数据库。
和普通数据库区别：普通库适合精确匹配；向量库适合语义相似度匹配。
常见用途：存放文档块向量、用户问题向量，供 RAG 快速检索。

四、RAG 细化完整链路（含隐藏子步骤）

文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库（存向量数据库）→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 + 用户提示词→ 大模型增强生成答案

五、语义检索核心逻辑

用户问题 → 转向量
和向量库里所有文档块向量算相似度
取出相似度最高的 Top-N 片段
作为参考资料给大模型

查看全文

http://www.jsqmd.com/news/775471/

提示词工程day2-day4

3分钟掌握ncmdump：让你的网易云音乐在任意设备自由播放

告别兼容性烦恼：ViGEmBus虚拟手柄驱动让Windows游戏体验全面升级

AI驱动的认知行为疗法实践：用cbt-llm-kit构建结构化情绪管理工具

AI+水文水资源实战：攻克非平稳序列预测、CMIP6降尺度、SWAT/EFDC/VIC模型自动化率定、启发式强化学习多目标优化（NSGA/MOEA/D）难关

第十九篇：《视觉回归测试：让UI自动化检测样式异常》

三步解锁原神帧率限制：从卡顿到流畅的完整技术指南

解锁硬件潜能：Universal x86 Tuning Utility全面评测与使用指南

XUnity.AutoTranslator：10分钟掌握Unity游戏实时翻译的完整指南

桌面AI工具集成平台cc-switch：原理、配置与效率提升实践

DoL-Lyra智能整合包：3分钟获得完整游戏美化体验的终极指南

基于MCP协议实现AI助手与Amazing Marvin任务管理系统的无缝集成

JetBrains IDE试用期重置终极指南：2026年开源解决方案详解

ShareGPT4V：用高质量数据提升多模态大模型视觉理解能力

OnmyojiAutoScript：阴阳师自动化脚本终极指南，20+任务智能托管解放双手

从代码片段到上下文理解：构建自动化代码分析工具的设计与实践

3步技术实现：深度解析Blender 3DM导入插件的架构设计与应用方案

规范驱动开发：基于OpenAPI的API设计先行实践指南

解锁Windows 10的Android生态：WSA-Windows-10移植项目完全指南

校园场景下 USB 诱饵攻击机理分析与安全防御体系研究

FPGA实现NFC读卡器：从射频电路到协议栈的硬核开发指南

Taotoken的按token计费模式让实验性项目成本可预测

算法基础（六）—— 大 O、Ω、Θ如何描述算法增长边界

矢量网络分析仪维修全攻略：常见故障与排查方法科普

观测ubuntu服务器调用taotoken api的延迟与token消耗情况

使用OpenClaw Agent工具时如何配置Taotoken作为其模型供应商

AI编程助手技能测试框架skillprobe：从概率性到工程化的实践指南

基于口碑数据的词云生成器：从中文分词到情感可视化的完整实践

NVIDIA Profile Inspector实战指南：深度优化显卡性能与游戏体验

华硕笔记本终极性能控制指南：用G-Helper轻松解锁完整潜能

一、文本分块

二、向量化与嵌入模型

三、向量数据库

四、RAG 细化完整链路（含隐藏子步骤）

五、语义检索核心逻辑

相关文章：