当前位置: 首页 > news >正文

NewAPI网关部署与企业Token监管实操指南

部署安装

这是整件事的地基。New API 支持 Docker 单容器、Docker Compose、1Panel、宝塔、集群部署等多种方式。企业内网场景推荐 Docker Compose,自带 postgres 和 Redis,数据不丢。

1.1 前置条件

一台 Linux 服务器(Ubuntu/CentOS),已装好 Docker 和 Docker Compose。建议最低 4 核 8G 。

1.2 Docker Compose 部署

git clone https://github.com/QuantumNous/new-api.git cd new-api git checkout v1.0.0-rc.4 #请checkout最新版本,这是2026年5月7日最新版本 vim docker-compose.yml # 根据实际修改端口、密码(改成强密码,默认都是123456) docker compose up -d

项目自带的docker-compose.yml已配好 postgres、Redis 和 New API 三个服务,只需改端口和密码。

1.3 初始化

服务启动后访问http://服务器IP:3000(端口建议使用80,并做外网的映射),首次打开会进入初始化引导,设置管理员账号密码。记好这个密码,后面所有管理操作都靠它。

模式采用自用模式

1.4 常用运维命令

docker logs -f new-api # 看实时日志 docker logs --tail=100 new-api # 看最近100行 docker ps # 查看服务状态 docker compose down # 在compose.yml同级目录执行,停止移除服务 docker compose up -d # 在compose.yml同级目录执行,重启服务

二、基础设置

2.1 速率设置

在"系统设置"→"速率限制设置"中,启用用户模型请求速率限制:

  • 限制周期1分钟
  • 用户每周期最多请求次数50次

2.2 系统设置

内部进行账号统一管理,不允许除管理员外的任何人登录该平台,所以做账号限制

在"系统设置"→"系统设置"中的配置登录注册处。关闭允许通过免密码进行注册允许新用户注册

在"系统设置"→"顶栏管理"中关闭模型广场、关于

2.3 绘图设置关闭

在"系统设置"→"绘图设置"中关掉全部绘图功能(如果你有生图模型就在此注意配置)

三、CodingPlan 的采集与分发

通常建议仅从一家采购同样的模型,提供团队内部统一使用

模型厂商采购 API Key │ ▼ New API 添加渠道,统一录入 Key │ ▼ 渠道分组,按部门/项目隔离 │ ▼ 创建订阅套餐,设定配额与有效期 │ ▼ 分发令牌给用户,绑定分组与限额 │ ▼ 用户通过令牌调用标准 API │ ▼ 日志审计与看板,全链路监管

3.1 渠道分组

不同部门、不同项目可能需要用不同的 Key 池。通过"分组"实现渠道隔离:创建分组(如"研发一部"、"产品二部"),在渠道中指定该渠道属于哪个分组,用户只能访问自己分组内的渠道。

在"系统设置"→"分组与模型定价设置"的分组管理中添加内部各部门的分组。

倍率都按照1设计

每个组视人数给分配账号,一般设定比人数多1个~2个账号即可

3.2 模型定价

模型定价的主要目的,是为了统一内部模型叫法,给模型设置统一的价格,方便后续的管理

设计示例如下:

xxx-glm-4.7:1$/1M Token xxx-kimi-k2.5:2$/1M Token xxx-kimi-k2.6:3$/1M Token xxx-glm-k2.6:3$/1M Token

3.3 添加渠道

每个采购到的 API Key 对应一个渠道。管理员登录后进入「渠道」页面:

  1. 选择服务商类型(一般使用 OpenAI / Claude 等)
  2. 名称,按照key来源构建,如厂商-key结尾4字符
  3. 填入 API Key(密钥)
  4. 勾选该 Key 支持的模型
  5. 高级配置中可设 Base URL(代理地址)
  6. 代理地址必须填写,根据国内模型厂商给的地址进行填写。一般国内模型厂商会给 Claude、OpenAI 两种接入方式的地址,跟选择的工具有关系。

3.4 多 Key 轮询

同一个服务商采购了多个 Key 时,用"多 Key 模式":一个渠道挂多个 Key,系统自动轮询使用。单个 Key 失败自动跳过,恢复后重新启用。支持两种轮询策略:顺序轮询和加权随机(建议按照加权随机的模式使用)。

http://www.jsqmd.com/news/1079672/

相关文章:

  • 数位DP:从“穷举数字”到“逐位拆解”
  • AI大模型应用开发工程师到底做什么?
  • 超长型材拉弯加工,实测数据与效果差异几何?
  • 11.3% 稳健增长!2026年温度敏感导电碳浆市场发展现状及未来前景趋势分析
  • 从 Demo 到上线,Agent 还差一套工程化底座
  • 住所地公证书去哪里办理?住所地公证需要什么材料?
  • ouTube Data API v3 视频详情接口(videos.list)完整介绍与标准 JSON 返回示例
  • VADER、TextBlob与Flair三工具协同情感分析实战
  • Bushound USB协议分析工具:从原理到实战的深度解析
  • erp,oa价格昂贵,企业私有化部署怎么降本?EzCloud 插件化架构解决定制开发长期痛点
  • Git提交用错email了? 用gitConfig来管理
  • SOS构造与负动量:凸凹优化收敛性证明的自动化路径
  • AI 编程多模型协同怎么落地:基于 Agent 路由、独立审查和 OpenCode 权限治理的工程实践
  • 新不良人0.1折下载
  • 数据分包传输技术详解:从原理到Python模拟实现
  • 为什么做了 DevOps,你还是管不好开源依赖?
  • 如何用NxNandManager轻松管理你的Switch NAND存储:免费开源工具完整指南
  • centos搭建k8s 1.28集群
  • Calico IPIP CrossSubnet 与 IPIP 默认模式对比模式介
  • 平衡二叉树:一棵懂得“自我纠偏“的智慧树
  • 百度旋转验证码模型更新及识别代码
  • 计算机毕业设计之jsp基于ssm的新冠疫情管理系统
  • 企业级大模型微调:从行为控制到业务闭环的实战方法论
  • JMeter压力测试实战:从单接口到混合场景的精准性能评估
  • 如何实现企业微信外部群的 API 主动调用?
  • 堡垒机如何连接数据库?网页堡垒机自动化踩坑与全套解决方案
  • GitHub Desktop中文汉化全攻略:告别英文界面,提升开发效率
  • 化工打印方案应用
  • AI 视频智能体平台 vs 传统剪辑团队,5 大功能模块逐项拆给你看
  • 电子产品可靠性测试DIC应用