当前位置: 首页 > news >正文

有考虑过ai自己grep调用记忆吗

https://www.bilibili.com/video/BV1iC4LzpE7p

你提到的视频《RAG已死?Claude Code核心开发者抛弃RAG》中,Claude Code 的核心开发者 Boris 提出了一种“完全不做索引”的反直觉检索方式——这实际上是在挑战传统 RAG(Retrieval-Augmented Generation)依赖向量数据库 + embedding 检索的范式。

而你问的:“有没有考虑过 AI 自己 grep 调用记忆?”,其实正契合了这一新思路的核心思想之一。


✅ 什么是 “AI 自己 grep 调用记忆”?

这里的 “grep” 是一个比喻,指的是:

  • 不预先构建向量索引
  • 而是让大模型在需要时,直接对原始文本(如代码库、文档、日志等)进行关键词或语义匹配式的“扫描”或“搜索”
  • 类似于程序员用grep在代码中查找字符串。

这种做法看似低效,但在以下条件下变得可行甚至更优:

  1. 上下文窗口极大(如 Claude 3.5 Sonnet 支持 200K+ tokens);
  2. 模型本身具备强大的长文本理解与定位能力
  3. 避免 embedding 偏差(embedding 可能丢失细节、受训练数据限制);
  4. 简化系统架构:无需维护向量数据库、同步索引、处理 chunk 切分等问题。

🔍 视频中的核心观点 vs “AI 自己 grep”

Boris 的做法本质上就是让模型直接读取整个代码库(或文档集)作为上下文,然后靠自身能力“找到”相关部分——这正是“AI 自己 grep”的体现。

他提到:“我们发现,只要把整个项目文件塞进上下文,模型自己就能精准定位到需要修改的函数,效果远超 RAG。”

这背后有几个关键优势:

  • 零信息损失:原始文本完整保留,没有 chunk 切断或 embedding 降维;
  • 动态推理:模型可根据任务需求灵活关注不同部分,而非受限于检索结果;
  • 减少 token 浪费:传统 RAG 检索可能返回大量无关 chunk,反而污染上下文。

🤖 这算不算 “AI 拥有记忆”?

严格来说,这不是“记忆”,而是“即时访问外部知识”。但若将整个代码库/文档视为其“扩展记忆”,那么:

  • 传统 RAG = 有索引的记忆(像图书馆目录)
  • Claude Code 方式 = 把整本书摊开让 AI 自己翻(像拥有 photographic memory)

未来方向可能是:

  • 对小规模、高价值数据(如个人笔记、私有代码)——直接全量注入上下文;
  • 对超大规模数据(如整个互联网)——仍需高效检索,但可能结合混合策略(如先粗筛再精读)。

💡 总结

是的,视频中提出的方法本质上就是“让 AI 自己 grep 调用记忆”——
它放弃传统 RAG 的索引机制,转而依赖大模型在超长上下文中的自主检索能力,
这在长上下文模型普及的今天,正成为一种更简洁、更可靠的新范式。

这也解释了为什么越来越多人说:“RAG 已死,Context is King.

如果你感兴趣,还可以关注“In-context retrieval”“Naive RAG” vs “Agentic RAG”的讨论,这正是当前 AI 工程化的重要演进方向。

http://www.jsqmd.com/news/311379/

相关文章:

  • 306. Java Stream API - 流特性
  • Vite + Vue3 + TS 封装阿里图标 SVG 全局组件
  • 翱捷科技 Android/Linux 芯片平台功耗软件工程师:核心技术解析与实战
  • 安卓驱动开发工程师职位深度解析与面试指南
  • 马斯克“无钱论”:乌托邦愿景还是技术狂想?
  • 2026年防潮箱厂家哪家好?行业技术实力企业推荐
  • 2026电子防潮箱厂家哪家好?行业实力品牌推荐
  • 2026循环水处理公司哪家强?行业实力品牌推荐
  • 2026发酵液过滤公司哪家好?业内推荐参考
  • 2026哪个品牌的袋式过滤器好?行业口碑之选
  • Vortice 使用 DirectComposition 显示透明窗口
  • WPF 使用 Vortice 在 D3DImage 显示 D2D 内容
  • 彻底爆了!阿里最新大模型,再次拿下第一!
  • Milvus+印度最大电商平台,如何打造服务两亿月活用户的商品比价系统
  • 数据库挂了导致的生产事故
  • Codeforces Round 1068 (Div. 2) D,E 题解
  • Educational Codeforces Round 129 (Rated for Div. 2) F. Unique Occurrences 线段树分治
  • Android System UI/Launcher开发工程师职位深度解析
  • 2026年1月电缆生产厂家推荐:电缆生产厂家排名、知名的电缆生产厂家推荐盘点名单
  • 深入解析:Android开发工程师的核心能力与实战面试指南
  • 2026年质量好的数码组合柔版印刷机/标签柔版印刷机信誉优质供应参考(可靠)
  • 亿航智能安卓工程师岗位深度解析与面试指南
  • 2026年评价高的亚克力浴缸/浴缸厂家口碑推荐汇总
  • 2026年知名的卫星式轮转印刷机/标签轮转印刷机厂家推荐与选择指南
  • 铁路地铁电力电缆生产厂家推荐:中低压、变频、聚乙烯绝缘、聚氯乙烯绝缘电缆生产厂家名单(2026年)
  • 2026年1月矿山煤矿电力电缆生产厂家推荐:中低压、变频、聚乙烯绝缘电缆
  • 2026年1月中国电缆一线品牌推荐:轨道交通、石油石化、矿山煤矿电缆国内一线品牌盘点
  • 2026年1月轨道交通电力电缆生产厂家推荐:中低压、变频、变频、聚乙烯绝缘电缆生产厂家
  • 2026年靠谱的酒店照明系统/酒店照明设计优选服务榜
  • 2026年口碑好的工程浮箱钢模板/圆柱钢模板厂家选购参考汇总