当前位置: 首页 > news >正文

使用llama_index 来实现一个RAG

环境

  • uv
  • ollama

RAG 的二个阶段

索引阶段 (Indexing Phase)

检索信息增强,让大模型参考本地的信息/文档,提高回答的质量

  • 加载数据 Indexing
  • 文档加载,分割,将加载的 文本 解析成一系列 Nodes
  • 生成 对每个node ,生成向量嵌入 然后存储在数据索引中

查询阶段 (Querying Phase)

  • 查询嵌入,根据用户的查询生成一个向量嵌入
  • 检索上下文. 利用检索器 进行相似度查询,找的相关的Nodes
  • 预处理,对Nodes列表转换,过滤
  • 合成响应
快速开始一个chat
from llama_index.core.agent.workflow import FunctionAgent
from llama_index.llms.ollama import Ollama
agent=FunctionAgent(llm=Ollama(model="gemma3:12b"),system_prompt="你是由在水一方公司创建的人工智能机器人"
)
async def chat(str):res = await agent.run(str)

llama_index 相关组件

llama_index 通过组件化的方式,将大语言模型,向量数据库,索引,数据源等进行组合。

  • 提示词组件 RichPromptTemplate ChatPromptTemplate MessageRole
from llama_index.core import ChatPromptTemplate
from llama_index.core.llms import ChatMessage,MessageRole
from llama_index.core.prompts import RichPromptTemplate
  • Loading 文档加载组件 把文件加载为Document , 然后拆分为Nodes
  • 文档索引
  • 存储
  • Setting 全局配置

RAG 模式

  • 本地知识库+模型 ,内存向量索引每次重建,实时构建
  • 持久化RAG 磁盘持久化向量库 多次复用
http://www.jsqmd.com/news/264133/

相关文章:

  • 小程序毕设项目:基于springboot的保护濒危动物公益网站系统(源码+文档,讲解、调试运行,定制等)
  • 【课程设计/毕业设计】基于springboot的保护濒危动物公益网站系统保护动物网站、濒危动物保护【附源码、数据库、万字文档】
  • 小程序计算机毕设之基于springboot的保护濒危动物知识科普、活动发布、在线捐赠公益网站系统(完整前后端代码+说明文档+LW,调试定制等)
  • 【毕业设计】基于springboot的保护濒危动物公益网站系统(源码+文档+远程调试,全bao定制等)
  • 666666999999 - 教程
  • 亲测好用2026研究生AI论文网站TOP10:开题文献综述全攻略
  • AionUi:与AI终端代理协作的跨平台桌面界面
  • HarmonyOS智慧农业管理应用开发教程--高高种地---第1篇:项目初始化与环境搭建
  • C++11的一些特性
  • 非标自动化设备工厂10个SolidWorks研发设计如何共享一台服务器的资源和算力 - 指南
  • Playwright数据库断言:测试前后数据验证
  • GESP认证C++编程真题解析 | 202309 一级
  • docker 搭建canal - BeYourSelf
  • GESP认证C++编程真题解析 | 202309 二级
  • 2026年中国985高校人工智能专业综合实力十强排名
  • js函数防抖
  • LeeCode_17 电话号码的字母组合
  • Selenium 从环境搭建到 Web 自动化实战
  • 通信原理篇---PAM与PCM
  • GESP认证C++编程真题解析 | 202309 四级
  • P1339 Heat Wave G
  • P2910 Clear And Present Danger S
  • 职场晋升需要 AI 证书,选偏理论还是偏实操的更有用?
  • TCP 协议深度解析与实践:从零基础到精通
  • 小程序毕设选题推荐:基于springboot+微信小程序的校园竞赛管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】
  • > STM32-200-多功能门禁人脸识别指纹识别RFID刷卡密码(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 数据质量与主数据管理:确保企业核心数据准确
  • 51-C40-温湿度检测+上下限+加热+空调降温+加湿+除湿+手动+自动+OLED屏+声光报警+按键+(无线方式选择)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 假期schedule
  • 数论2:gcd、lcm与exgcd