当前位置: 首页 > news >正文

【技术底稿 10】16G Ubuntu 服务器手动部署 Ollama 0.20.4 全流程(避坑 HTTP2 错误)

一、环境说明

  • 系统:Ubuntu 22.04 LTS
  • 内存:16GB
  • 安装方式:手动二进制部署(非官方脚本、非 Docker)
  • 适用场景:本地大模型推理、RAG 向量知识库、个人 DevOps 平台底层环境

二、前置准备

安装包:ollama-linux-amd64.tar.zst采用离线包部署,避开官方 curl 脚本下载慢、HTTP2 framing error 等网络问题。

三、安装步骤

1. 安装 zst 解压工具

bash

运行

sudo apt update && sudo apt install zstd -y

2. 解压安装包

bash

运行

# 解压 zst 为 tar zstd -d ollama-linux-amd64.tar.zst # 解压 tar 包 tar -xf ollama-linux-amd64.tar

3. 移动到系统目录并赋权

bash

运行

sudo mv bin/ollama /usr/local/bin/ sudo chmod +x /usr/local/bin/ollama

4. 验证安装版本

bash

运行

ollama --version

图 1:ollama --version版本验证成功截图,显示客户端版本 0.20.4 即为安装完成。

5. 启动 Ollama 服务

bash

运行

ollama serve

图 2:ollama serve启动成功界面,出现Listening on 127.0.0.1:11434代表服务正常运行。

6. 拉取向量模型(RAG 专用)

bash

运行

ollama pull nomic-embed-text

图 3:nomic-embed-text向量模型下载中,受网络环境影响,下载速度较慢,可通过配置国内镜像、手动离线导入等方式优化。

7. 查看已安装模型

bash

运行

ollama list

四、常见问题

  1. 官方脚本下载失败使用二进制离线包,彻底规避 HTTP2 网络错误、连接超时。
  2. 模型下载速度慢可配置国内镜像加速,或多次断点续传。
  3. 服务后台常驻

    bash

    运行

    nohup ollama serve &

五、实战说明

本次使用二进制手动部署,相比 Docker 更轻量、相比官方脚本更稳定,16GB 内存服务器可稳定运行向量模型与轻量大模型,作为后续 AI 知识库、RAG 系统的底层推理环境

六、后续规划

下一步部署 Milvus 向量数据库,打通 Ollama + Milvus 本地 RAG 知识库完整链路。


关注我

持续更新《人生底稿》成长史 &《技术底稿》&《产品底稿》实战干货一起踏实成长,不焦虑、不内卷。

📚 系列导航:

【人生底稿 01】|农村少年(1995–2005)

【技术底稿】01:37岁老码农,用4台机器搭了套个人DevOps平台

【产品底稿01】37 岁 Java 老码农,用 Java 搭了个 AI 写作助手,把自己 14 年技术文章全喂给了 AI!

http://www.jsqmd.com/news/621581/

相关文章:

  • 空气质量指数解析:PM10、PM2.5、CO、NO2、SO2的健康影响与防护指南
  • 如何利用Tree of Thoughts提升大语言模型推理能力:完整实现指南
  • 终极指南:探索golang-samples项目的最新功能与实战应用
  • M5NanoC6开发板底层驱动与ESP32-C6多协议工程实践
  • 2026年比较好的风管安装精选厂家推荐 - 品牌宣传支持者
  • 一天一个Python库:oauthlib - 轻松构建OAuth客户端和服务器兜
  • 【SITS2026官方未公开技术白皮书】:AI原生应用性能跃迁的5大硬核优化范式(含实测QPS提升237%数据)
  • 深入解析PCIe LTSSM中的Recovery.Equlization机制与多速率适配
  • Teeworlds游戏引擎架构分析:客户端与服务端核心组件
  • 弦音墨影模型压缩与量化教程:降低部署资源门槛
  • L07A音响系统分析:在尝试固化SSH服务过程中遇到的技术问题
  • Cinny状态管理:Jotai在现代React应用中的应用
  • 【数据解析】深入理解 OpenLane-V2 数据集结构与核心标注
  • Laravel与ThinkPHP5.x核心对比
  • [实战指南]从零构建并发布一款Edge浏览器效率工具插件
  • 2026年Q2农业虫害监测优质品牌推荐:植物补光灯/便携式虫害监测设备/农业虫害监测/可视化虫害监测设备/智能虫害监测设备/选择指南 - 优质品牌商家
  • Aruco_ROS:开启高效AR标记识别的机器人之旅
  • Ruoyi-vue-plus多租户权限设计避坑指南:7个常见问题及解决方案
  • 终极Sugar.js指南:让JavaScript原生对象操作变得简单高效
  • styleguide41/styleguide深度解析:CSS规范与命名约定的完整清单
  • 城通网盘解析技术深度解析:浏览器端直连解决方案实现原理与实践
  • 从SP3232E看现代便携设备RS-232接口的ESD防护与低功耗设计
  • 2024后端开发语言选择指南:Python/Java/Go/JS/Rust终极对比
  • 2026年4月市场头部工业省电空调品牌推荐分析,知名的工业省电空调机构深度剖析助力明智之选 - 品牌推荐师
  • Dify+Ollama模型搭建攻略:本地环境实战指南驼
  • 线上接口超时排查实战:从日志分析到代码优化全流程
  • frpc-desktop与云函数集成:实现无服务器内网穿透终极指南
  • Vue-YDUI 移动端组件库终极指南:10个高效开发技巧揭秘
  • 魔百和CM201-YS救砖记 此型号emmc混发且易老化
  • GitHub Readme Streak Stats:打造个性化贡献统计卡片,展示你的编程热情