当前位置：首页 > news >正文

没公网IP怎么远程访问本地部署的大模型？Ollama + cpolar，任何网络环境下都能调用

news 2026/8/3 18:02:58

文章目录

- 1 痛点引入
- 2 方案架构与流程对比
- - 2.1 不同方案横向对比
  - 2.2 核心调用纵向流程
- 3 手把手落地步骤
- - 3.1 第一步：本地部署Ollama运行大模型
  - 3.2 第二步：安装配置Cpolar内网穿透
  - 3.3 第三步：配置Ollama服务内网穿透
  - - 3.3.1 临时测试：一键启动
    - 3.3.2 生产部署：永久配置+开机自启
  - 3.4 第四步：远程调用验证
  - - Python调用示例
    - TypeScript(Node.js)调用示例
- 4 方案性能量化对比
- 5 生产级部署安全审计方案
- - 5.1 访问控制
  - 5.2 日志与审计
  - 5.3 合规性
- 6 技术前瞻性分析
- 7 附录：完整技术图谱
- 总结

1 痛点引入

现在越来越多开发者和AI爱好者选择在本地部署大模型，既可以保障数据隐私，也能节省云端部署的高昂成本。但绝大多数家庭和企业网络都没有公网IP，运营商默认分配的是内网地址，即使端口转发、DDNS配置都做了，还是没法在外网远程调用本地大模型，出门想测试、给合作伙伴做演示都非常不方便。

传统解决方案中，自搭FRP需要额外购买带公网IP的VPS，还要维护配置，技术门槛高；免费版Ngrok国内节点少、延迟高还限速，根本没法正常用。本文提供一个零门槛、可落地的生产级方案，用Ollama+Cpolar组合，不需要公网IP就能实现随时随地远程调用本地大模型，小白也能一步步跟着操作。

2 方案架构与流程对比

2.1 不同方案横向对比

本部分通过横向流程图对比当前主流方案的优劣，直观展现本方案的优势：

2.2 核心调用纵向流程

整个请求链路清晰，全程加密，数据不落地第三方：

3 手把手落地步骤

3.1 第一步：本地部署Ollama运行大模型

Ollama是当前最流行的本地大模型部署工具，支持全平台，安装非常简单：

Windows/Mac：直接到Ollama官网下载安装包，下一步完成安装即可。
Linux执行一键安装命令：

curlhttps://ollama.ai/install.sh|sh

安装完成后，拉取你需要的大模型，这里以通义千问7B为例，适合大多数普通硬件运行：

ollama run qwen:7b

验证Ollama是否正常运行，新开终端执行以下命令：

curlhttp://localhost:11434/api/generate-d'{ "model": "qwen:7b", "prompt": "你好", "stream": false }'

如果正常返回推理结果，说明Ollama部署成功。

3.2 第二步：安装配置Cpolar内网穿透

首先到Cpolar官网注册账号，在后台个人中心获取你的Authtoken，免费版足够个人测试使用。然后安装Cpolar：

Linux一键安装命令：

curl-Lhttps://install.cpolar.cn/dl/cpolar-stable-linux-amd64.tar.gz|tar-xzsudocpcpolar /usr/local/bin/

Windows/Mac：官网下载安装包，直接完成安装即可。
安装完成后配置Authtoken，替换成你自己的token：

cpolar authtoken 你的Authtoken

验证安装成功：

cpolar version# 输出版本号说明安装配置正常

3.3 第三步：配置Ollama服务内网穿透

提供两种使用方式，临时测试用命令行，生产部署用配置文件加开机自启：

3.3.1 临时测试：一键启动

直接执行命令，即可生成公网访问地址：

cpolar http11434

执行完成后，输出中会显示类似https://abc123.cpolar.cn的公网地址，直接用这个地址即可远程访问。

3.3.2 生产部署：永久配置+开机自启

编辑Cpolar配置文件，默认路径为~/.cpolar/cpolar.yml，配置内容如下：

version:"2.0"authtoken:"你的Authtoken"tunnels:ollama-http:proto:httpaddr:11434subdomain:"your-custom-ollama"# 自定义固定二级域名，专业版支持authentication:"admin:your-strong-password"# 生产必须开启基础认证

配置systemd开机自启，新建/etc/systemd/system/cpolar.service，内容如下：

[Unit] Description=Cpolar 内网穿透服务 After=network.target [Service] Type=simple User=root ExecStart=/usr/local/bin/cpolar start-all Restart=always RestartSec=10 [Install] WantedBy=multi-user.target

执行以下命令启动服务并设置开机自启：

sudosystemctl daemon-reloadsudosystemctlenablecpolarsudosystemctl start cpolarsudosystemctl status cpolar

看到active (running)说明启动成功。

3.4 第四步：远程调用验证

提供多语言调用示例，可直接运行测试：

Python调用示例

importrequests# 替换为你的Cpolar公网地址OLLAMA_ENDPOINT="https://your-custom-ollama.cpolar.cn/api/generate"USERNAME="admin"PASSWORD="your-strong-password"payload={"model":"qwen:7b","prompt":"请介绍一下什么是大语言模型","stream":False}response=requests.post(OLLAMA_ENDPOINT,json=payload,auth=(USERNAME,PASSWORD))ifresponse.status_code==200:result=response.json()print("大模型返回结果：",result["response"])else:print(f"请求失败，状态码：{response.status_code}")

TypeScript(Node.js)调用示例

importaxiosfrom"axios";constOLLAMA_ENDPOINT="https://your-custom-ollama.cpolar.cn/api/generate";constUSERNAME="admin";constPASSWORD="your-strong-password";asyncfunctioncallOllama(prompt:string):Promise<string>{try{constresponse=awaitaxios.post(OLLAMA_ENDPOINT,{model:"qwen:7b",prompt:prompt,stream:false,},{auth:{username:USERNAME,password:PASSWORD},});returnresponse.data.response;}catch(error){console.error("调用失败：",error);throwerror;}}// 测试调用callOllama("请介绍一下什么是大语言模型").then(console.log);

运行代码能正常输出结果，说明配置成功。

4 方案性能量化对比

下表是对不同方案的量化测试对比，测试环境为国内500M家庭宽带：

方案类型	平均延迟	最大带宽	可用性	是否需要公网IP	维护成本	年成本	适用场景
公网直连	~10ms	跑满本地带宽	99.99%	是	低	0	有公网IP企业用户
自搭FRP	~35ms	受VPS带宽限制	99%	否(需VPS公网)	高	￥50-300	有技术能力团队
Ngrok免费版	~160ms	~1Mbps	95%	否	低	0	境外用户测试
Cpolar免费版	~70ms	~2Mbps	98%	否	极低	0	个人开发者测试
Cpolar专业版	~50ms	~10Mbps	99.9%	否	极低	￥300左右	生产/团队共享场景

5 生产级部署安全审计方案

企业生产使用必须做好安全控制，以下是经过验证的安全方案：

5.1 访问控制

基础身份认证：Cpolar原生支持配置账号密码，不需要额外开发，配置方式已经在之前的配置文件中体现。
IP白名单：登录Cpolar后台，在对应隧道配置中添加IP白名单，只允许企业指定IP段访问，进一步降低未授权访问风险。
接口权限控制：如果只需要开放推理接口，不需要远程拉取/删除模型，可以用Nginx反向代理拦截敏感接口，配置示例：

server { listen 11435; server_name localhost; location ~* /api/pull|/api/delete { return 403; } location / { proxy_pass http://127.0.0.1:11434; } }

之后穿透11435端口即可，只允许推理访问。

5.2 日志与审计

开启Ollama调试日志：编辑Ollama的systemd服务文件，添加环境变量Environment=OLLAMA_DEBUG=1，日志默认输出到syslog，方便排查问题和审计。
配置日志轮转，防止日志占满磁盘，新建/etc/logrotate.d/cpolar-ollama：

/var/log/cpolar/*.log /var/log/ollama/*.log { daily missingok rotate 14 compress notifempty create 0640 root root }

5.3 合规性

本方案所有用户数据和模型都存储在本地，Cpolar只做流量转发，不存储任何业务数据，符合国内等保2.0和数据隐私合规要求。

6 技术前瞻性分析

端侧和本地大模型已经成为明确的行业趋势，随着消费级GPU性能提升，当前主流消费显卡已经可以流畅运行70B参数大模型，本地部署的隐私和成本优势越来越明显，对远程访问本地大模型的需求会持续增长。
传统自搭内网穿透方案需要持续维护服务器，技术门槛高，对个人开发者和中小团队不友好，一站式零维护的内网穿透方案会成为主流选择，本方案适配国内网络环境，延迟更低，使用体验更好。
方案扩展性极强，未来本地部署多AI Agent、多模型的场景下，只需要添加新的隧道配置即可，不需要改动整体架构，可以无缝适配业务增长。
数据不出域的部署模式，完美适配政府、金融、医疗等对数据隐私要求高的行业，比将大模型部署到公有云更合规，本方案可以直接用于企业内部远程办公场景。