当前位置：首页 > news >正文

《Llamaindex大模型RAG开发实践》笔记

news 2026/3/27 0:31:36

关联知识库：《Llamaindex大模型RAG开发实践》笔记

Workflow

import data(llamaHub)
create doc from source data
create textNode from docs
create index from textNode

import data

xxReader
cloud service

Data to Doc

simple one
by sentence
by token
for code(AST)

NodeParser

by sentence
use LangChain module
markdown
json
...

metadata setting 质>量

手动
自动提取器
- Summary Extractor
- Title one
- Keyword one
- Pydantic lib
- marvin

数据隐私与脱敏 HuggingFace LLM

import pipeline 4 cache

Build Index

Custom Setting

Settings

LLM
Embedding
Index Parser

About package chain

metadata(摘要，关键词等等)
index（摘要，关键词，树，知识图谱）
retriever（向量检索器，摘要检索器等）

以上，属于llamaindex封装好的简单rag构建链路。
同时，llamaindex也提供更加定制化，精细化的构建方式

检索器原理

遍历索引并选取相关节点以构建所需上下文

default: VectorIndexRetriever
xxRetriever
xxSelector
密集检索和稀疏检索以及混合检索
small-to-big 检索
and so on
（是本书，也是本目录）

后处理

节点的筛选，优化

过滤，转换，重排序

xxPostprocessor

or 基于大模型的后处理器

xxRerank
eg：LongLLMLinguaPostprocessor
2310.05736v2

评估重排的有效性：

基准数据集
用户反馈收集
AB测试
。。。

响应合成

输出解析

结构化输出

LangchainOutputParser
Pydantic

Chain so far

节点
索引
检索器
后处理器
响应合成器
输出解析器
查询引擎

查询引擎

QueryEngine

SubQuestionQueryEngine 多步骤推理的复杂查询

聊天引擎 4 对话历史记录

ChatEngine 多轮对话

结合上下文的问题压缩模式

LLMCompiler智能体

规划
分派
执行

llamaindex ：AgentRunner & AgentWorker

C9 - C11

llamaindex高度定制化特性
RAG核心：LLM & Embddding Modol

本地运行

llama.cpp
Ollama
LM Studio

OpenRouter 模型路由

llama packs

追踪评估

Phoenix（span，trace）
RAGAS

部署

streamlit社区云

基于对话代理的界面会简化用户的交互体验

展望

当模型能够处理相当长的上下文，我们还是否需要RAG？

永远不要停止学校的步伐，因为追求知识是一条永无止境的道路

查看全文

http://www.jsqmd.com/news/63192/

CMake初探篇一

# AWS全球宕机：DNS故障引发互联网级连锁反应

# 智能编辑器与传统IDE混合使用实践指南

# 【Context7 MCP测试】 RAG技术栈深度调研：Context7 MCP实战测试报告

# 35岁外包被裁后的一键复仇：Schultz事件背后的科技行业内部威胁新趋势

# LinkedIn代码重构失败案例：300万行代码的迁移困境与组织文化反思

一只菜鸟学深度学习的日记：入门卷积

# 【测试场景2】2025年10月AI行业动态深度报告：技术突破、市场动向与产业洞察

AI规则管理实践经验：规则过多与AI注意力问题

# RAG开创性论文解读：检索增强生成的技术革命（Meta AI 2020）

Markdown图标美化Prompt

# RAGAS论文解读：RAG评估的标准框架（2023）

人机共创精简价值Prompt

可复用Prompt识别与生成专家Prompt

# HyDE论文解读：零样本密集检索的巧思（2022）

Scalar使用说明

# 思维链提示论文解读：开启LLM推理能力的钥匙（Google 2022）

警惕！React服务器组件爆出高危远程代码执行漏洞

.NET Core 微服务之Grpc远程调用

用 C++ + OpenCV + Tesseract 实现英文数字验证码识别

用 PHP（Laravel）+ ImageMagick + Tesseract 实现验证码识别