当前位置：首页 > news >正文

Ollama端口暴露风险与防护

news 2026/7/5 5:02:23

1. Ollama Pull API 测试（34-85行）：核心功能是使用 Ollama 的 /api/pull 接口拉取模型。
主要特点：
- 使用 requests.post 发送 POST 请求到 http://localhost:11434/api/pull
- 设置 stream=True 以支持流式响应
- 处理 NDJSON 格式的响应（每行一个 JSON 对象）
- 响应包含状态信息：status、digest、total、completed
- 使用 tqdm 进度条显示下载进度
关键点：
- 模型名称：glm-4.7-flash（被注释的有 qwen3-vl:4b, glm-4.6:cloud, glm-5:cloud）
- 响应用 b'\n' 分割（OLLama 使用换行符分隔 NDJSON）
- 实时更新 tqdm 进度条
这是一个简单的测试脚本，不是 pytest 测试文件。
这是一个 Ollama 模型拉取脚本，用于从本地 Ollama 服务下载模型。
主要功能：
- 向 http://localhost:11434/api/pull 发送 POST 请求
- 设置 stream=True 接收流式 NDJSON 响应
- 实时解析下载进度并用 tqdm 显示进度条
响应格式示例：
{"status":"pulling 9c60bdd691c1","digest":"sha256:...","total":3295612832,"completed":95273168}
关键处理逻辑：
- 用 b'\n' 分割流式响应（Ollama 使用换行分隔 NDJSON）
- 提取 status、total、completed 字段
- 当获取到 total 大小时创建 tqdm 进度条
- 累积更新进度条显示下载进度
当前配置：
- 目标模型：glm-4.7-flash
- 当前机器上 Ollama 地址：localhost:11434

# 方式一：使用 requests import requests import json from tqdm import tqdm #进度显示 response = requests.post(f"http://localhost:11434/api/pull", json=data, stream=True) resBuffer :bytes= b'' res :bytes= b'' ts = {} for line in response.iter_content(): #{"status":"pulling 9c60bdd691c1","digest":"sha256:9c60bdd691c1897bbfe5ddbc67336848e18c346b7ee2ab8541b135f208e5bb38","total":3295612832,"completed":95273168} ''' 88 {"status":"pulling 9c60bdd691c1","digest":"sha256:9c60bdd691c1897bbfe5ddbc67336848e18c346b7ee2ab8541b135f208e5bb38","total":3295612832} 9a {"status":"pulling 9c60bdd691c1","digest":"sha256:9c60bdd691c1897bbfe5ddbc67336848e18c346b7ee2ab8541b135f208e5bb38","total":3295612832,"completed":78020} ''' res += line r = res.split(b'\n') res = r.pop() for j in r: if b'status' in j: msg = json.loads(j.decode()) status = msg.get('status','') total = msg.get('total') #提取总大小 completed= msg.get('completed') #提取已经下载量 tq =ts.get(status) if total and tq is None: tq = tqdm(range(total)) ts[status] = tq if tq and completed: tq.update(completed) #更新进度

只看见端口没有主机登录权限时使用, 所以正常ollama的端口不能暴露出去(别人可以恶意下载,占网速/硬盘)

查看全文

http://www.jsqmd.com/news/504173/