当前位置：首页 > news >正文

Clawdbot+Qwen3:32B部署教程：从零搭建Web网关直连聊天服务

news 2026/7/5 21:48:44

Clawdbot+Qwen3:32B部署教程：从零搭建Web网关直连聊天服务

1. 准备工作与环境检查

在开始部署前，请确保你的系统满足以下最低要求：

操作系统：Linux（推荐Ubuntu 22.04 LTS）或macOS（Intel/Apple Silicon）
硬件配置：
- 至少24GB可用内存（Qwen3:32B推理需约20GB显存或内存）
- 推荐使用NVIDIA GPU（RTX 3090/4090或更高）
软件依赖：
- Python 3.9+
- curl/wget工具
- 管理员权限（sudo）

Windows用户建议使用WSL2，避免PowerShell兼容性问题。运行以下命令检查基础环境：

# 检查Python版本 python3 --version # 检查内存（Linux） free -h # 检查GPU（如有） nvidia-smi

2. Ollama服务安装与模型加载

2.1 安装最新版Ollama

Qwen3系列需要Ollama v0.4.0+才支持完整上下文长度和流式响应。执行以下命令安装：

# 卸载旧版本（如有） sudo apt remove ollama -y && sudo rm -rf /usr/bin/ollama # 下载并安装v0.4.2 curl -fsSL https://ollama.com/install.sh | sh # 启动服务并设为开机自启 sudo systemctl start ollama sudo systemctl enable ollama # 验证服务状态 systemctl status ollama

2.2 拉取Qwen3:32B模型

执行以下命令拉取模型（国内用户建议配置镜像源）：

# 配置国内加速（可选） export OLLAMA_HOST=0.0.0.0:11434 ollama serve & # 拉取模型（约18GB） ollama pull qwen3:32b # 测试模型响应 echo "你好" | ollama run qwen3:32b

如果看到类似"你好！很高兴见到你"的回复，说明模型加载成功。

3. Clawdbot服务配置

3.1 下载并启动Clawdbot

Clawdbot将作为Web网关与Ollama之间的桥梁：

# 创建工作目录 mkdir -p ~/clawdbot && cd ~/clawdbot # 下载Linux版本（macOS替换为darwin-arm64） wget https://github.com/clawdbot/releases/download/v1.3.0/clawdbot-linux-x64 -O clawdbot # 赋予执行权限 chmod +x clawdbot # 启动服务 nohup ./clawdbot --host 0.0.0.0 --port 8080 --model qwen3:32b --ollama-url http://localhost:11434 > clawdbot.log 2>&1 &

3.2 验证Clawdbot连接

测试Clawdbot是否能正确调用Ollama：

curl -X POST http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "qwen3:32b", "messages": [{"role": "user", "content": "用一句话介绍你自己"}], "stream": false }'

预期返回包含Clawdbot自我介绍的JSON响应。

4. 端口转发与Web访问配置

4.1 设置端口转发规则

将8080端口转发到18789网关：

# 启用IP转发 echo 'net.ipv4.ip_forward = 1' | sudo tee -a /etc/sysctl.conf sudo sysctl -p # 添加转发规则 sudo iptables -t nat -A PREROUTING -p tcp --dport 18789 -j REDIRECT --to-port 8080 sudo iptables -t nat -A OUTPUT -p tcp --dport 18789 -d 127.0.0.1 -j REDIRECT --to-port 8080 # 保存规则 sudo apt install iptables-persistent -y sudo netfilter-persistent save

4.2 验证端口转发

curl -I http://127.0.0.1:18789

应返回HTTP 200状态码。

5. Web聊天界面使用

5.1 访问聊天界面

在浏览器中输入：

http://<your-server-ip>:18789

5.2 功能测试

尝试以下交互：

发送简单问候
进行多轮对话
测试长文本生成

观察响应速度和质量，正常情况应在2秒内得到回复。

6. 常见问题解决

6.1 模型加载缓慢

解决方案：

echo 'FROM qwen3:32b PARAMETER num_ctx 32768 PARAMETER num_gqa 8 PARAMETER flash_attention false' > ~/.ollama/modelfile ollama create my-qwen3 -f ~/.ollama/modelfile ollama run my-qwen3

6.2 端口无法访问

检查步骤：

确认iptables规则存在
检查云服务器安全组设置
验证本地防火墙规则

6.3 CORS跨域问题

重启Clawdbot时添加参数：

./clawdbot --host 0.0.0.0 --port 8080 --model qwen3:32b \ --ollama-url http://localhost:11434 \ --cors-allowed-origins "*" \ --cors-allowed-headers "Content-Type,Authorization"