当前位置: 首页 > news >正文

MiniRAG + LLM (二)

  • 安装 MiniRAG 的 Python 依赖,会报错
pip install -r requirements.txt
  • 原因,需要 Python 的 3.11 版本
# 安装 pyenv 依赖(通用方法,适用于所有的 Python 旧版本)
apt update
apt install -y make build-essential libssl-dev zlib1g-dev \
libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm \
libncursesw5-dev xz-utils tk-dev libxml2-dev libxmlsec1-dev libffi-dev liblzma-dev git
# 安装 pyenv
curl https://pyenv.run | bash
# 添加环境变量到 ~/.bashrc
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
echo '[[ -d $PYENV_ROOT/bin ]] && export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
echo 'eval "$(pyenv init -)"' >> ~/.bashrc
# 重新加载配置
source ~/.bashrc
# 编译安装 Python 3.11.9(需要几分钟)
pyenv install 3.11.9
  • 然后你会发现,又又又报错了
# 放弃,不装了,说不定用不到这些环境依赖
# 再试一把吧
# 从你的 requirements.txt 中注释掉 graspologic
# 这玩意 跟 Python 3.13 不兼容,需要 13 以下的版本
# 删除原来的虚拟环境,重新安装 3.12 再激活(有空再补)
  • 装点别的库
# 基础科学计算库
pip install scipy pandas scikit-learn
# 文档处理和工具库
pip install pypdf2 python-docx chromadb sentence-transformers
# json库
pip install json-repair
# 文件分片库
pip install tiktoken

启动 LLM

proot-distro login ubuntu
ollama run deepseek-r1:1.5b

给 RAG 投喂

# Termux 下挂载手机存储termux-setup-storage
# Ubuntu 下拷贝投喂 PDF 和 DOCXcp /sdcard/Download/6_总体设计方案_JZ.docx ~/ai/MiniRAG/documents/

创建文档处理脚本

nano build_index.py
# 等我学完官方例程先
# 未完待续 ……………………………………
http://www.jsqmd.com/news/425309/

相关文章:

  • 一文梳理清大数据领域CAP定理,轻松驾驭数据
  • 电动汽车充放电调度优化:全局与局部方案的比较及性能分析
  • 鸿蒙应用开发UI基础第十四节:文本显示组件Text核心讲解与实战演示 - 鸿蒙
  • Java求职面试实战:微服务与安全框架场景问题解析
  • 玩转STM32F1驱动双雄:BLDC与PMSM的攻防战
  • 从 Java 到 Go:一场性能革命
  • 使用C语言实现STM的启动文件
  • 探索大数据领域Doris的核心特性与优势
  • AI推理能力革命:如何打造高性能原生应用?
  • Android 开发问题:FileProvider: java.lang.SecurityException: Provider must not be exported
  • 大数据时代:用户画像助力企业精准营销
  • 使用 pkgutil 实现动态插件系统
  • 自注意力机制详解:从原理到计算过程
  • 东莞直饮水机服务商怎么选?靠谱服务商推荐 - 小坤哥
  • 记一次AI Agent开发的思维误区
  • 其他-vscode-配置
  • 最小二乘问题详解:线性最小二乘实例
  • ZooKeeper 的 Watcher 机制的底层实现
  • macos:从命令行启动device模拟器
  • 在手机上运行AI模型
  • 创新是改良式的(Incremental Innovation),但是,有些创新是颠覆式的(Disruptive Innovation ...
  • OpenClaw 安装与配置API教程(Mac电脑,超详细喂饭)
  • 【节点】[DielectricSpecular节点]原理解析与实际应用
  • 东莞直饮水机厂家怎么选?5家靠谱供应商推荐 - 小坤哥
  • [CS:APP 3e] 关于对 第 12 章 读/写者的一点思考和题解 (作业 12.19,12.20,12.21)
  • 我怀疑我的论文泄露了!自查AI率很低,编辑查AI率很高是怎么回事?
  • 序列变换 2
  • DP、计数(1,但是没有 2)
  • sorMcp\neoj-community-.. 下载来源:https://we-yun.com/doc/neoj/../neoj- ...
  • 使用midscene对某网站进行登录和简单业务测试