当前位置: 首页 > news >正文

RAG 检索模型如何学习:三种损失函数的机制解析

Agent 系统发展得这么快那么检索模型还重要吗?RAG 本身都已经衍生出 Agentic RAG和 Self-RAG(这些更复杂的变体了。

答案是肯定的,无论 Agent 方法在效率和推理上做了多少改进,底层还是离不开检索。检索模型越准,需要的迭代调用就越少,时间和成本都能省下来,所以训练好的检索模型依然关键。讨论 RAG 怎么用的文章铺天盖地,但真正比较检索模型学习方式的内容却不多见。

检索系统包含多个组件:检索嵌入模型、索引算法(HNSW 之类)、向量搜索机制(余弦相似度等)以及重排序模型。这篇文章只聚焦检索嵌入模型的学习方式。

本文将介绍我实验过的三种方法:Pairwise cosine embedding loss(成对余弦嵌入损失)、Triplet margin loss(三元组边距损失)、InfoNCE loss。

成对余弦嵌入损失

正样本对示例

负样本对示例

输入是一对文本加一个标签,标签标明这对文本是正匹配还是负匹配。和 MNLI 数据集里的蕴含、矛盾关系类似。

损失函数用的是余弦嵌入损失,x 和 y 分别是文本对的嵌入向量。

三元组边距损失

输入变成三个文本:一个锚文本、一个正匹配、一个负匹配。

损失函数是 Triplet Margin Loss。公式里 a 代表锚文本嵌入,p 代表正样本嵌入,n 代表负样本嵌入。

InfoNCE 损失

输入包括一个查询、一个正匹配、一组负样本列表。

损失函数采用 InfoNCE,灵感来自 M3-Embedding 论文(arxiv:2402.03216)。公式中 p* 是正样本嵌入,P’ 是负样本嵌入列表,q 是查询嵌入,s(.) 表示相似度函数,比如余弦相似度。

比较

哪种方法最好?要看具体场景、数据量和算力。从我的实验来看,InfoNCE 覆盖面最广。但只要实验做得够充分、训练数据比例调得够细,余弦嵌入损失也能达到差不多的效果。三元组边距损失我没有深入探索,不过它可能是介于另外两者之间的一个折中选项。
https://avoid.overfit.cn/post/7958652dd31e4cf5ace899b97e0eac27

作者:Jerald Teo

http://www.jsqmd.com/news/285882/

相关文章:

  • 【课程设计/毕业设计】基于SpringBoot3+Vue3面向大学生的职业兴趣评估与就业指导平台基于springboot的面向大学生的职业兴趣评估与就业指导平台【附源码、数据库、万字文档】
  • Langchain 快速入门(一)
  • 微信小程序开发公司哪家比较好?最新测评报告给你答案
  • 100dB 深度消回音 + AI 智能降噪!WX-0813 语音处理模组,重塑全场景音频通话体验
  • YOLO26改进 - SPPF模块 | SPPELAN 空间金字塔池化与增强局部注意力:替代SPPF增强多尺度上下文捕获,提升检测精度
  • 【毕业设计】基于springboot的食品安全管理系统(源码+文档+远程调试,全bao定制等)
  • 2026全国学历提升机构TOP10盘点:选课攻略+避坑指南
  • 微信小程序商城怎么开通?来自程序员的实用教程
  • ffmpeg 二叉树代码测试及分析 - 详解
  • Java毕设项目推荐-基于SpringBoot的在线食品安全信息平台系统基于springboot的食品安全管理系统【附源码+文档,调试定制服务】
  • Java毕设选题推荐:基于springboot的企业智慧知识产权资产运营平台企业内部知识产权管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 2026年拼多多代运营公司排名前五权威深度测评
  • 2026执业药师考试培训前十机构测评:通关攻略与避坑指南
  • Java毕设项目推荐-基于springboot高校学生就业信息推送系统springboot的面向大学生的职业兴趣评估与就业指导平台【附源码+文档,调试定制服务】
  • 实现Unity录音、百度云语音转文字
  • Java毕设选题推荐:基于springboot大学生就业服务平台springboot的面向大学生的职业兴趣评估与就业指导平台【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 亿可达×飞书:一键搞定定时群通知,告别人工重复提醒
  • 2026最新版!微信小程序SaaS模板平台前十排名报告
  • 深入解析:Rust 练习册 :Matching Brackets与栈数据结构
  • 2026 年 AI PPT 工具深度评测:拒绝 “科技与狠活”,寻找真正能解决职场痛点的生产力工具
  • 2026年专业深度测评:淘宝代运营公司排名前五权威榜单
  • 【计算机毕业设计案例】基于Java的在线食品安全信息平台基于springboot的食品安全管理系统(程序+文档+讲解+定制)
  • Java毕设项目:基于springboot的食品安全管理系统(源码+文档,讲解、调试运行,定制等)
  • AI代码质检员:如何用大模型提前揪出软件缺陷?
  • 湖州职业技术学院:Wi-Fi 7全覆盖,打造智慧校园“湖职样本”
  • Linux命令创意
  • :计算机Java毕设实战-基于springboot的食品安全管理系统食品安全档案管理系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • Vue3底层原理——keep-alive
  • :vtkBooleanOperationPolyDataFilter 布尔运算全解析
  • 2026年拼多多代运营服务商专业深度测评:排名前五权威榜单