当前位置：首页 > news >正文

RAG（检索增强生成）会不会消亡呢？

news 2026/7/17 12:23:30

最近不少同学在简历或面试里提到做过 RAG（Retrieval-Augmented Generation）项目，开口就是：

“我在这个项目中使用LangChain搭建RAG的链路，从而确保回答更加准确，减少了大模型的幻觉问题。具体而言，我参与了数据清洗、索引构建、知识库搭建……”

我先说结论——这段描述听起来没错，但也没什么用。

“面试官视角”会怎么想？

来，咱们换个身份——假设你现在是算法部门面试官，你老板天天追着你要**“有模型理解能力、有工程能力、有创新意识”，要“超出预期”**。现在来了个候选人，讲了一通“我接了个LangChain流水线，然后做了数据清洗、建了索引、调了Embeddings”（很普通的流水线工作），你的第一反应是什么？

大概率是以下三种想法：

❌“没有自己的思考”：工具都现成的，照着官方教程搭的吧？
❌“算法创新能力欠缺”：LangChain + FAISS 这谁不会啊？你改了什么？
❌“干了很多边角料的活”：你不是建模的，是“工程打下手”的（并且你还觉得打下手的工作挺好）？

很多同学看到这可能会很泄气，“那怎么办，我就是做了这些啊…”

其实大家都是做的这些，别焦虑，别否定自己！！！！

问题不在于你做了什么，而在于你怎么表达、表达了什么深度。

RAG 是个热门方向，竞争者也多，只有靠独特思路 + 技术细节 + 明确结果才能脱颖而出。

怎么让RAG项目“写得有含金量”？

咱们可以从下面三个角度去改进描述：

1️⃣ 你理解了RAG的核心挑战吗？还是只是搭了链？

不要只说“我用LangChain搭了RAG”，真正的深度在于：你是不是理解了RAG常见的技术难点和优化空间？

比如下面这些问题你有没有想过或处理过：

检索阶段：
是不是用的Dense Retrieval？Embedding模型选得合理吗？有没有做query rewriting？
索引结构：
用FAISS还是自研召回机制？压缩策略？
评估方式：
你怎么知道召回好不好？有用Precision@k？还是自己打标？
Prompt设计：
你有没有做过RAG Prompt优化，比如引导式摘要、多段拼接、answer-aware检索？
是否有闭环反馈机制
，比如结合用户点击/评分动态调整召回？

如果你对这些有动手、有理解，那就应该在简历中体现出来，而不是被“我搭了个LangChain”这种表述遮掉了亮点。

2️⃣ 能量化你的贡献结果吗？还是止步于“我做了XXX”？

光说“我做了数据清洗、索引构建”没意义，因为听起来谁都能做，没有细节，也不知道你做了多少。

你要让面试官看到你做了之后发生了什么变化，比如：

RAG系统Top-5召回率从62%提高到79%
模型回答中的hallucination比例下降了23%
吞吐性能提升至每秒并发查询300+
用户侧满意度问卷得分从3.8提高至4.5

哪怕不是很硬的指标，也可以说“将原始知识文本中50%冗余段落过滤掉，有效提升召回效率和内容匹配度”。

3️⃣ 你是否有主动“改进”或“优化”链路？有没有自己的洞察？

（⚠️我面试的时候最关心的）这是区分“工具使用者”与“问题解决者”的关键。

举几个例子

✅ 正确的描述方式：

“初始RAG链路基于LangChain + FAISS，回答准确率不高。分析后发现Query意图和文档匹配偏差大，手动引入Query Rewriting模块，并自定义了Embedding聚合策略，将Top-1命中率从42%提升至68%。此外，在Prompt中引入多轮上下文压缩逻辑，进一步减少幻觉出现。”

这段好在哪？

有问题：原系统效果差

有动手：做了query重写 + embedding调整

有创新：自定义聚合逻辑

有结果：准确率提升了

就算你做的事情是工程侧的，也可以写出价值：

“原始RAG系统存在响应慢问题，通过索引预热、多进程重构检索逻辑，将平均响应时间从1.2s降低至0.4s，在多轮问答中体验更流畅。”

我反复提过的四段式结构，其实也适用于RAG项目：

[任务背景]
：项目做什么场景，为什么用RAG？
[你的职责]：你负责哪部分，解决了什么问题？
[技术细节]：用了什么方法，有哪些调整/创新？
[量化结果]：效果如何？指标、体验、性能有什么提升？
⬇️ 一个我觉得写的还不错的项目（进行了隐私和数据处理）
“为企业客服场景构建RAG问答系统，目标是减少大模型幻觉、提升垂类问题回答准确率。项目中负责召回与Embedding优化，初期基于LangChain+FAISS链路进行搭建。通过引入多粒度文本切分策略（标题、段落、QA级别）与自定义query改写模块，将Top-3召回准确率从61.7%提升至81.4%。同时优化Prompt结构，引导模型回答依据来源，显著提升答案可解释性。系统部署后，用户问答点击留存率提升约18.9%。”

写到这里，想到一个非常关键的，是不要写无效的句子，这在很多简历中我都看到了，一定一定要避免⬇️

错误写法	问题在哪
“使用LangChain搭建RAG链路”	没有具体贡献，像是照着官方文档抄的
“参与数据清洗和索引构建”	没有细节，不知道你做了多少
“减少了幻觉问题”	如何减少的？有没有量化？
“实现了更准确的回答”	没有指标、没有对比，空口说白话

做RAG项目吧，关键不是你做了RAG，而是你对RAG做了什么。简历中我想看见的是一个“动了脑子、动了手、有影响”的“人”（简历中要有人味）。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～