当前位置: 首页 > news >正文

42.llama_index-说明

内容参考于:图灵AI大模型全栈

langchain去搞Agent了对RAG兼容性太差了,可以说没有RAG的功能了,这里停止更新langchain,接下来开始写新的框架llama_index,它好使

LLama_index框架

api文档地址:https://developers.llamaindex.ai/python/framework-api-reference/

官网地址: https://developers.llamaindex.ai/python/framework/getting_started/starter_example/

项目地址:https://github.com/run-llama/llama_index

LlamaHub (开源的“插件市场): https://llamahub.ai/

llamaIndex最开始的名字叫GPT Index,它是目前大语言模型(LLM)最核心的数据框架之一,它解决了RAG问题

llamaIndex发展史

2022.11 项目启动:Jerry Liu 提交首版代码,定名 GPT Index,核心是树状索引(Tree Index),用于突破 GPT-3 上下文限制,后续补充列表、关键词两类索引结构。

2022.12 能力补全:新增 Embedding 与向量存储支持,接入 Notion、Slack、Google Drive 等首批数据源,初步形成完整 RAG 基础链路。

2023.01 社区破圈:登上 GitHub Trending,在开发者群体中快速获得关注度。

2023.02 生态起步:联合 Jesse Zhang 上线 LlamaHub 插件仓库,通过社区活动征集到 50+ 数据加载器,搭建起插件生态雏形。

2023.03 品牌与商业化落地:同步完成两件大事 —— 一是正式更名 LlamaIndex,规避品牌冲突并锚定通用 LLM 数据框架定位,同时快速适配 ChatGPT API 与官方插件;二是完成 Greylock 领投的 850 万美元种子轮融资,联合 Simon Suo 成立公司,转向全职商业化运作。

2024 能力全面升级:从基础向量检索拓展至高级 RAG、多智能体系统、全链路评估体系,跻身 RAG 领域主流框架行列。

2025 企业级架构重构:推出 Workflows 异步流程编排、LlamaParse 高精度文档解析、LlamaAgents 多智能体调度等核心能力,战略重心转向 Agentic RAG 与生产级文档自动化。

2026 至今 产品矩阵深化:持续迭代 LlamaParse v2、LlamaSplit、LlamaSheets 等产品,强化多模态解析、企业级部署与生态建设,成为生产级 RAG 与智能体应用的核心基础设施。

LLamaIndex架构图

通过架构图可以看出,

数据接入层:LLamaIndex可以接受本地文件、网页、数据库、api、云存储、第三方工具

摄取管道层:它还可以文本分割(各种格式的文档),元数据的提取,嵌入模型(向量模型,把切分好的文本转成向量)

缓存层:把向量数据保存到内存数据库,它支持很多数据库

Node层:在LLamaIndex中切片之后的数据被称为节点(Node),切片之后的数据分三种 纯文本数据(Text)、图片数据(Image)、索引数据(index,切片之后的结果)

索引层:在存储向量数据时,不一股脑全存起来,要有一个数据格式,比如给向量搞一个分类,比如语文向量、数学向量、物理向量它们都单独放一个地方,比如找语文向量就去专门存放语文向量的地方找

存储层:它有向量存储、文档存储、索引或图存储,这个是保存到硬盘上持久化

检索层:检索器、重排器

查询引擎层:查询引擎(把检索的功能封装到一起),对话引擎

响应合成层:比如现在检索出3个文档,现在做的事情是3个文档做拼接,拼接的时候会存在数据不完整,这时让大模型对3个文档分别进行优化,然后在进行拼接

Agent层:智能体,这里后面会专门写

Workflow层:工作流

LLM层:支持的大模型


http://www.jsqmd.com/news/1106051/

相关文章:

  • 实战指南:如何用Silk-V3-Decoder解决微信QQ语音播放难题
  • 机器人(狗)、AGV/AMR自动乘梯简易方案(技术解析与补充
  • 极简架构设计:少一层抽象,少一类故障
  • python: Handshaking Pattern
  • 电池充放电测试该怎么测?从分体拼方案到回馈一体机,这篇文章讲透了
  • OpenHarmony 英语学习 App 实战:悬浮导航栏、沉浸光感与全新交互体验
  • 【信息科学与工程学】【制造工程】第八十三篇 计算机系统集成制造01
  • 字节豆包AI编程助手扩展:深度解析其代码能力边界与实战表现
  • EM3080-W与PIC32MZ的嵌入式条形码解码系统设计
  • 什么是数字工厂全要素智造中枢与适用于哪种企业
  • LeetCode 23.合并K个升序链表
  • Android 7系统日志(四)日志写入接口—Java层与Native层
  • Codex 插件生态全景:从官方工具到社区神器
  • 工程化应用基础设施:可观测性要覆盖 提示词、检索和执行
  • HBM Predictor安装与配置教程:简单5步搭建预测环境
  • Visa、Stripe等140余家机构联合推出Open USD稳定币,剑指Tether
  • 第92题 IGBT模块封装用高可靠铝线键合与铜线键合
  • 2026手机证件照制作工具实操指南:免费无水印软件梳理与收费坑避雷
  • Windows安卓应用安装神器:APK Installer完全指南 - 3分钟掌握跨平台应用管理
  • 年入100亿压缩机龙头IPO!1.66亿诉讼案未决,应收账款质量恶化
  • 让大模型跑在小芯片上:工程挑战比口号更硬
  • 番茄小说下载器终极指南:三分钟打造个人离线图书馆的完整教程
  • 记录:2026.7.1
  • 告别复杂配置!Claude Code完整安装指南,小白也能10分钟上手(Linux/WSL2)
  • 从 Hermes Agent 到 Harness 工程:AI Agent 落地,靠的不只是大模型
  • 单帧像素推演三维空间,SpaceOS联动Pixel2Geo打通单画面实景重建全链路
  • YOLOv11 改进 - C2PSA C2PSA融合EDFFN高效判别频域前馈网络(CVPR 2025):频域筛选机制增强细节感知,优化复杂场景目标检测
  • novel-downloader:三步搞定网络小说永久保存的终极指南
  • ChatGPT Plus / Pro 付款后没看到结果,先查这几步
  • 原生Signals正式落地、管道操作符终结“嵌套地狱”、WebNN调用NPU算力——4个让前端代码“减重”50%的ES2026特性