当前位置：首页 > news >正文

一篇文章讲清楚：中转API如何用Python调用ChatGPT

news 2026/7/6 8:27:40

你是否遇到过这样的场景？
想把 ChatGPT 接入自己的应用，却被模型限制、价格波动、接口差异搞得一头雾水；
刚写好的代码，换一个模型就要重构一遍；
好不容易跑通了，又发现前端、后端、流式输出全都要重新适配。

现在，这些问题可以用一个“中转 API”一次性解决。

本教程将手把手带你使用神马中转API兼容 OpenAI Chat Completions 的中转 API，通过 Python 快速部署一个可切换多模型的 ChatGPT 应用。无论你使用的是 OpenAI、Claude、Gemini、DeepSeek，还是其他对话模型，只需要一个统一接口、一套请求格式，就能完成调用。

这套中转API是什么

这套神马中转API接口兼容OpenAI 的 Chat Completions 格式：你只需要在请求体里改 model，就可以切换 OpenAI / Claude / Gemini / DeepSeek / Grok / Qwen 等模型。

你给的接口是Chat(聊天)：

方法：POST
路径：/v1/chat/completions

准备工作：Base URL 与 API Key

文档说明：

BaseURL：通常是神马中转API域名，也可以在工作台页面查看
API key：在令牌页面获取

你可以把它们放到环境变量里（推荐）：

export GPT_BEST_BASE_URL="你的BaseURL（例如：https://api.whatai.cc）" export GPT_BEST_API_KEY="你的API_KEY"

按文档拼请求：Header + Body

Header

文档示例里用的是：

Accept: application/json
Authorization: Bearer {{YOUR_API_KEY}}
Content-Type: application/json

Body

请求体（application/json）文档示例包含这些字段：model、messages、temperature、top_p、n、stream、stop、max_tokens、presence_penalty、frequency_penalty、logit_bias、user、response_format、seen、tools、tool_choice。

最小可用通常是 model + messages，其他按需加。

Python同步请求示例（requests）

import os import requests BASE_URL = os.getenv("GPT_BEST_BASE_URL") # 你的 BaseURL，https://api.whatai.cc) API_KEY = os.getenv("GPT_BEST_API_KEY") if not BASE_URL or not API_KEY: raise RuntimeError("请先设置 GPT_BEST_BASE_URL 和 GPT_BEST_API_KEY 环境变量") url = f"{BASE_URL.rstrip('/')}/v1/chat/completions" # 接口路径 headers = { "Accept": "application/json", "Authorization": f"Bearer {API_KEY}", # Bearer 方式 "Content-Type": "application/json", } payload = { "model": "gpt-4o-mini", # 按需替换成你要用的模型名 "messages": [ {"role": "system", "content": "你是一个严谨的编程助手。"}, {"role": "user", "content": "用Python写一个快速排序，并解释时间复杂度。"}, ], "temperature": 0.7, "top_p": 1, "n": 1, "stream": False, # 非流式 "max_tokens": 800, } resp = requests.post(url, headers=headers, json=payload, timeout=60) resp.raise_for_status() data = resp.json() # 返回格式示例：choices[0].message.content print(data["choices"][0]["message"]["content"]) print("usage:", data.get("usage"))

Python流式输出示例（stream=true）

文档请求体里有 stream: true 字段示例。

流式一般是服务端不断返回分片（常见是 SSE：data: ...）。

import os import json import requests BASE_URL = os.getenv("GPT_BEST_BASE_URL") API_KEY = os.getenv("GPT_BEST_API_KEY") url = f"{BASE_URL.rstrip('/')}/v1/chat/completions" headers = { "Accept": "application/json", "Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json", } payload = { "model": "gpt-4o-mini", "messages": [ {"role": "user", "content": "请用三句话解释什么是递归，并给一个Python例子。"} ], "stream": True, # 流式 "temperature": 0.6, } with requests.post(url, headers=headers, json=payload, stream=True, timeout=60) as r: r.raise_for_status() for line in r.iter_lines(decode_unicode=True): if not line: continue # 常见 SSE 行：data: {...} 或 data: [DONE] if line.startswith("data:"): line = line[len("data:"):].strip() if line == "[DONE]": break try: chunk = json.loads(line) except json.JSONDecodeError: # 如果服务端不是 SSE 格式而是纯JSON片段，可在这里按需兼容 continue # OpenAI 风格流式：choices[0].delta.content delta = chunk.get("choices", [{}])[0].get("delta", {}) content = delta.get("content") if content: print(content, end="", flush=True) print() # 换行

“部署一个 ChatGPT 应用”的最小后端：FastAPI转发（可选）

这个小服务做两件事：

接收你自己的前端请求
转发到中转 API 的 /v1/chat/completions（仍然保持文档要求的 Header/Body 结构）

import os import requests from fastapi import FastAPI, HTTPException from pydantic import BaseModel BASE_URL = os.getenv("GPT_BEST_BASE_URL") API_KEY = os.getenv("GPT_BEST_API_KEY") app = FastAPI() class ChatReq(BaseModel): model: str messages: list temperature: float | None = None top_p: float | None = None n: int | None = None stream: bool | None = None stop: str | None = None max_tokens: int | None = None presence_penalty: float | None = None frequency_penalty: float | None = None logit_bias: dict | None = None user: str | None = None response_format: dict | None = None seen: int | None = None tools: list | None = None tool_choice: dict | None = None @app.post("/chat") def chat(req: ChatReq): if not BASE_URL or not API_KEY: raise HTTPException(status_code=500, detail="Missing GPT_BEST_BASE_URL / GPT_BEST_API_KEY") url = f"{BASE_URL.rstrip('/')}/v1/chat/completions" # headers = { "Accept": "application/json", "Authorization": f"Bearer {API_KEY}", # "Content-Type": "application/json", } resp = requests.post(url, headers=headers, json=req.model_dump(exclude_none=True), timeout=60) if resp.status_code != 200: raise HTTPException(status_code=resp.status_code, detail=resp.text) return resp.json()

启动（示例）：

uvicorn your_file_name:app --host 0.0.0.0 --port 8000

返回结果怎么看

文档给的返回示例结构是：

choices: 数组
choices[0].message.role/content
usage.prompt_tokens / completion_tokens / total_tokens

你在 Python 里通常取：

data["choices"][0]["message"]["content"]

查看全文

http://www.jsqmd.com/news/299121/

智能井盖安全监测系统的设计与实现

深度测评9个论文写作工具，自考学生一键生成论文工具推荐！

【节点】[NormalVector节点]原理解析与实际应用

我在运动-轨迹查看器

我在这儿--给照片加定位

2026年做得好的上海花旗大厦广告代理公司联系方式，上海外滩广告/电视台广告/公交广告，户外led大屏广告公司推荐

如何在Azure Pipeline中使用PowerShell从OneDrive for Business下载指定文件

YOLOv26自行车部件检测识别系统实现

35.LRU 缓存

初学者使用 docker 快速体验 TDengine 功能

【LeetCode】四数之和 - 指南

我在哪儿-- 照片定位查看助手

2026年企业AI获客必看：GEO服务商选型权威指南

LoRA微调target module设置

Claude Skills 保姆级教程：无脑照做就能用出效果

人工智能之核心技术深度学习第一章神经网络基础

慢充3.3kW占20%，普通7kW占50%，快充11kW占20%，超充20kW占10

2026年青少年心理辅导优选名单，口碑机构来助力，家庭教育指导/叛逆孩子教育/青少年心理咨询，青少年心理辅导学校排名

完整教程：目前流行的前端框架

电力市场出清程序。 IEEE14节点考虑输电阻塞，求解机组边际电价和节点边际电价。采用拉格朗...

单北斗GNSS在桥梁和地质灾害变形监测中的应用与发展

【LeetCode】91. 解码方法 - 教程

2026 主流GEO服务商全景图谱，企业GEO服务商选型指南

三相与两相步进方案的矢量控制及超前角控制：内置微控制器的技术解析

光伏储能交直流微电网matlab/simulink仿真，风光储能联合发电系统simulink仿...

双亲表示法构造树-----Java实现

KiCad V10新特性前瞻

电气设计的隐藏外挂：1:1元器件图库实战

基于传统材料力学势能法的健康齿轮时变啮合刚度数值分析

Product Hunt 每日热榜 | 2026-01-25