当前位置：首页 > news >正文

LlamaIndex高级使用

news 2026/7/14 0:30:31

什么是 LlamaIndex 在 Rag 发挥的作用以及与传统 Rag 的区别

1.LlamaIndex 简介

LlamaIndex（原 GPT Index）是一个专门为大模型构建索引、检索和数据管道的框架，核心目标是让 LLM 更好地连接和利用私有数据。

传统 RAG 通常是这样实现的：# 传统 RAG 伪代码
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains import RetrievalQA# 1. 切分文档
texts = text_splitter.split_documents(documents)# 2. 向量化 + 存储
vectorstore = FAISS.from_documents(texts, OpenAIEmbeddings())# 3. 检索 + 生成
qa_chain = RetrievalQA.from_chain_type(llm=llm,retriever=vectorstore.as_retriever()
)

问题：

数据加载、切分、索引需要自己写很多代码
检索策略单一（通常是简单的向量相似度）
缺乏对数据结构的深度优化
难以处理复杂的多模态、多源数据

LlamaIndex 在 RAG 中的作用

  1. 数据连接层from llama_index import SimpleDirectoryReader, VectorStoreIndex# 一行代码加载多种数据源documents = SimpleDirectoryReader('data').load_data()# 支持 PDF、Markdown、JSON、数据库、API、Notion 等 100+ 数据源2. 智能索引策略from llama_index import VectorStoreIndex, ListIndex, TreeIndex# 不同索引策略适应不同场景vector_index = VectorStoreIndex.from_documents(documents)  # 向量索引tree_index = TreeIndex.from_documents(documents)           # 树形索引（层次化）list_index = ListIndex.from_documents(documents)           # 列表索引（顺序检索）3. 高级检索能力# 混合检索：向量 + ��键词query_engine = index.as_query_engine(retrieval_mode="hybrid",  # 混合检索similarity_top_k=5,alpha=0.7  # 向量检索权重)# 自动重查询（Query Transformation）query_engine = index.as_query_engine(mode="recursive_retrieve",  # 递归检索use_async=True,)4. 结构化数据解析from llama_index.readers import SimpleReader# 自动识别表格、图表、层级结构documents = reader.load_data(file_path="report.pdf",extract_tables=True,  # 提取表格extract_images=True   # 提取图片)

核心优势示例

传统 RAG 检索（简单向量检索）

只能找到语义相似的片段
query = "公司的财务状况如何？"
返回：提到"财务"的某个片段，可能不准确

LlamaIndex 检索（智能路由 + 多层检索）

自动理解查询意图，选择最优检索路径
query = "公司的财务状况如何？"