当前位置: 首页 > news >正文

为什么现在 RAG 越来越少被提及?

RAG 不再是热词,但你的搜索栏离不开它。不是它没用,而是早期过度承诺和工程瑕疵让人失望。

RAG 没有过时,它只是从聚光灯下沉到基础设施。

热度的冰与火

RAG 从爆火到降温,2023年Q4顶峰后2024年平缓下降。但RAG 并未消失,只是进入理性期,生产中频频翻车的原因集中在检索质量、延迟、维护成本。

检索:阿克琉斯之踵

大多数 RAG 系统只用简单的向量相似度搜索,忽略语义匹配和排序,缺少Query Rewriting、混合检索、Reranker等环节,效果打折扣。理想 RAG 检索准确,现实却是检索到无关片段,回答胡编

延迟成本:工程代价

每次推理增加200-500ms延迟,维护知识库的持续清洗和向量重计算成本甚至超过模型推理。很多团队低估了这些资源消耗。

新范式分流

长上下文模型和 Agent 方案分流了 RAG 的热度。但RAG 在需要外部知识库低频更新的场景仍有优势,不再是唯一选择。

正确用法:场景匹配

RAG 最适合知识库频繁更新、需要精确引用、数据可分割的场景,必须做检索质量工程。可复用实践:

python

# 先用 BM25 粗排,再向量精排from rank_bm25 import BM25Okapifrom sentence_transformers import SentenceTransformerbm25 = BM25Okapi(tokenized_corpus)model = SentenceTransformer('all-MiniLM-L6-v2')# 粗排 top 50bm25_scores = bm25.get_scores(query_tokens)top_bm25 = np.argsort(bm25_scores)[-50:]# 精排 top 3embeddings = model.encode([corpus[i] for i in top_bm25])query_emb = model.encode([query])scores = util.cos_sim(query_emb, embeddings)[0]top_indices = np.argsort(scores)[-3:]

设置可信度阈值,缓存高频查询可降低延迟。

检索质量是 RAG 的阿克琉斯之踵。

技术的关键不是追新,而是匹配问题。

RAG 没有过时,它只是从聚光灯下沉到基础设施。别被热度左右,回到业务场景做选择——慢慢来,技术是一步一步走出来的

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/1106001/

相关文章:

  • CF710F String Set Queries 题解
  • 深度学习核心架构与工业部署实战指南
  • 选芯片编程烧录座,这3个专业性价比最稳
  • 3分钟上手AutoScreenshot:Windows和Linux自动截屏神器
  • Qt-摄像头捕获画面
  • 直流电机静音控制方案:从PWM优化到PCB布局
  • 大规模服务 ROI 评估:别让概念替代成本账本
  • 【2026年华为暑期实习(AI)-7月1日-第一题- 选择题】(题目+思路+JavaC++Python解析+在线测试)
  • 【项目实战】基于OpenCV和BDD100K数据集的辅助驾驶车道线检测与碰撞预警系统
  • 卡梅德生物科普:CD48(SLAMF2)的免疫调控机制与研究工具选择
  • SQL 复杂查询优化:先减少扫描,再谈语法漂亮
  • Better BibTeX 终极指南:告别LaTeX文献管理的混乱时代
  • 6. 深入 Nginx 核心:HTTP 11 个处理阶段与模块开发实战
  • 轻量级AI模型实战:低配设备部署与优化指南
  • 【2026年华为暑期实习(AI)-7月1日-第三题- Certainty Forcing 训练损失计算】(题目+思路+JavaC++Python解析+在线测试)
  • 基于ICM-42605和GD32VF103的6DOF运动追踪系统设计
  • adb截图-------在小程序中实现纯 JS 驱动的 ADB 客户端
  • 输入输出流重载说明:std::ostream operator<<(std::ostream os, const Vector v)
  • AI 辅助:前端工程化效率:快不是少检查,而是少返工
  • Python在AI开发中的核心优势与实战技巧
  • 变分量子本征求解器(VQE)原理与NISQ设备应用
  • 深度学习Pipeline与Baseline构建指南
  • 【6.20】射频\+FPGA\+Verilog\+仪器自动化 完整知识链路复盘
  • 智能体时代,软件工程的本质
  • 现在系统运行基本上正常,较少遇到问题了
  • 采齿背后的能量闭包原理
  • 截屏、OCR、翻译、录屏全打包?这款开源软件,一个快捷键搞定所有!
  • OpenHarmony 英语学习 App 实战:从 0 到 1 搭建中小学生英语学习应用
  • 工程化赋能传统业务工作流:先找重复劳动,不要先找服务
  • 大模型评测与AI产品质量保障:第7篇 机器学习的三种学习范式