当前位置: 首页 > news >正文

搭建ai大模型集群

1、目的
使用 OpenClaw 作为 AI 智能体编排框架,结合本地 Ollama,构建一个能够执行自动化任务的 AI 集群
2、环境
环境
云主机 云主机 云主机
操作系统 Rockylinux 9.6 Rockylinux 9.6 Rockylinux 9.6
CPU/内存 4核/4G 4核/4G 4核/4G
内网IP 192.168.88.20 192.168.88.30 192.168.88.30
硬盘 40G 40G 40G

3.施工前准备
配置三台主机配置hosts文件,能ping通
关闭firewalld和selinux
安装依赖:dnf install -y curl wget git vim net-tools telnet

4.部署过程
ollawa node1和ollawa node2执行).
创建数据目录并启动ollama容器
docker run -d
--name ollama
--restart unless-stopped
-v /opt/ollama/data:/root/.ollama
-p 11434:11434
ollama/ollama
image
image
下载模型
docker exec -it ollama ollama pull ops-hansir:latest
ollama list
image
image
配置nginx负载均衡器(Nginx LB执行)
mkdir -p /etc/ssl/ollama
生成自签名证书(测试用)
openssl req -x509 -nodes -days 365 -newkey rsa:2048
-keyout /etc/ssl/ollama/privkey.pem
-out /etc/ssl/ollama/fullchain.pem
-subj "/C=CN/ST=Beijing/L=Beijing/O=Company/CN=ollama.company.com"
配置nginx文件
Vim /etc/nginx/conf.d/ollama-cluster.conf
配置如下:
upstream ollama_cluster {
least_conn; # 最少连接数算法,适合长连接任务
server 192.168.88.20:11434 max_fails=2 fail_timeout=60s;
server 192.168.88.39:11434 max_fails=2 fail_timeout=60s;
}

HTTP 重定向到 HTTPS(可选)

server {
listen 80;
server_name ollama.company.com;
return 301 https://$server_name$request_uri;
}

HTTPS 主服务

server {
listen 443 ssl http2;
server_name ollama.company.com;

# SSL 证书配置
ssl_certificate /etc/ssl/ollama/fullchain.pem;
ssl_certificate_key /etc/ssl/ollama/privkey.pem;
ssl_protocols TLSv1.2 TLSv1.3;
ssl_ciphers HIGH:!aNULL:!MD5;# 日志
access_log /var/log/nginx/ollama-access.log;
error_log /var/log/nginx/ollama-error.log;# 代理 Ollama API
location /api/ {proxy_pass http://ollama_cluster;proxy_buffering off;                    # 必须!支持流式输出proxy_http_version 1.1;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;proxy_read_timeout 3600s;               # 长连接超时proxy_connect_timeout 60s;proxy_send_timeout 60s;
}# 健康检查端点(可选)
location /health {access_log off;return 200 "OK\n";add_header Content-Type text/plain;
}

}
重载nginx:
nginx -t
image
Systemctl reload nginx
验证https
image

Openclaw安装(无需node.js)
Curl -fsSL https://openclaw.ai/install.sh | bash 直接安装
浏览器访问:
image

http://www.jsqmd.com/news/532901/

相关文章:

  • 使用IDEA插件提升效率:在开发环境中直接调用MiniCPM-o-4.5
  • 如何构建Headplane现代化Web管理界面:容器化部署终极指南
  • Granite TimeSeries FlowState R1开发环境配置全攻略:从零开始搭建AI预测项目
  • 头皮精华成分分析:哪种成分最适合你的头皮问题? - 博客万
  • 三. Java特性、版本、JDK/JRE/JVM
  • OpenClaw技能开发套件:为Qwen3.5-4B-Claude定制专属工具
  • 2026年3月,探寻市面上好的喷雾干燥机厂家,流化床干燥机/单锥干燥机/耙式干燥机/闪蒸干燥机,喷雾干燥机批发厂家分析 - 品牌推荐师
  • 毕业设计:基于springAi+vue的非遗数字文化馆(源码)
  • 众智商学院:助力外审员备考与能力进阶 - 众智商学院官方
  • 重构前端路由开发范式:vite-plugin-pages 从原理到实践
  • Avalonia+VSCode实时预览开发指南:用ReactiveUI快速构建响应式桌面应用(含项目结构解析)
  • FLUX.1-dev像素工坊应用场景:像素化无障碍界面设计——高对比度UI生成
  • 起猛了,发现我的工位上坐着一只“硅基吸血鬼”!
  • 10分钟快速掌握QQ空间历史说说备份神器
  • 分析金丝绒瓷砖生产商,莱曼缔克在泉州、佛山、肇庆的口碑如何? - 工业设备
  • 防脱精华品牌对比:日系、欧美、国货三足鼎立大PK - 博客万
  • TranslucentTB:为Windows任务栏注入透明美学的轻量级神器
  • ssm+java2026年毕设数据学院工作量管理系统【源码+论文】
  • 2026年杭州吸塑板材口碑榜,瑞新吸塑板材专业度咋样 - 工业品网
  • Anything V5效果展示:一键生成高质量二次元角色肖像图
  • C#读写各类配置文件
  • Leather Dress Collection 惊艳效果展示:多风格时尚文案与设计描述生成
  • Elden Ring帧率解锁终极指南:突破60帧限制的完整教程
  • CRM系统评测:如何避开功能缺陷,选择全球化支撑能力强的AI平台? - 纷享销客智能型CRM
  • 书匠策AI:问卷设计的“古法匠心”与“智法革新”大碰撞
  • hadoop+spark+hive链家租房租房推荐系统 租房可视化 K-means聚类算法 线性回归预测算法 机器学习
  • 深度剖析5大智能内容解锁策略:Chrome付费墙突破技术全解
  • 【数据结构与算法】第3篇:C语言核心机制回顾(二):动态内存管理与typedef
  • Ubuntu系统上通义千问1.5-1.8B-Chat-GPTQ-Int4的部署教程
  • 嵌入式通信协议设计原则与实现技巧