当前位置：首页 > news >正文

主流大模型 API 快速上手

news 2026/6/12 12:39:02

一、引言

AI 大模型时代，每个软件从业者都必须掌握的 API 技能

如果你从事软件开发、运维、测试、数据分析、产品经理——任何与软件相关的岗位——那么过去两年你一定频繁听到一个词：大语言模型（Large Language Model, LLM）。

从 ChatGPT 的横空出世，到 Claude 在代码理解上的突破，再到通义千问、Gemini、文心一言等国产模型的迅速崛起，AI 大模型已经从"前沿技术实验"变成了"行业标准工具"。它正在重塑我们构建软件的方式：

智能客服24/7 自动应答，大幅降低人工成本
代码助手自动补全、代码审查、Bug 修复
内容生成营销文案、技术文档、多语言翻译
数据分析自然语言查询数据库，自动生成报表
知识管理构建企业知识库，实现智能问答

而这一切的基础，都是API 调用。

为什么你必须学会调用大模型 API？

很多人会问："我用 ChatGPT 网页版不就行了吗？为什么要学 API？"

答案很简单：网页版是玩具，API 才是生产力工具。

网页版只能一对一聊天，API 可以嵌入你的产品
网页版无法批量处理，API 可以自动化流水线
网页版无法定制，API 可以调整参数、接入自有数据
网页版无法规模，API 可以支撑百万级用户

无论你是想在产品中集成 AI 能力，还是想用 API 自动化日常工作中的重复任务，掌握大模型 API 调用都是一项必备技能。

这篇文章能帮你做什么？

本文将手把手带你完成从注册到调用的完整流程，覆盖目前主流的五大大模型平台：

平台	代表模型	特点
OpenAI	GPT-5.4, GPT-5.4 mini	生态最成熟，文档最完善
阿里通义千问	Qwen-Max, Qwen-Plus	中文能力强，国内访问快
Anthropic	Claude Sonnet 4	代码理解出色，安全性高
Google	Gemini 2.0	多模态能力强，免费额度大
百度	ERNIE 4.0	中文理解好，国内生态完善

每个平台都会覆盖：注册流程、获取 API Key、Python/Node.js 调用示例、计费说明、速率限制。

准备好了吗？我们开始！

二、大模型 API 入门基础

在开始之前，你需要了解的核心概念

调用大模型 API 之前，有几个核心概念必须理解。它们是所有平台的通用语言，理解了这些，你才能高效使用任何大模型服务。

1. Token（词元）

Token 是大模型处理文本的基本单位。

大模型不是按"字"或"词"来处理文本的，而是按 Token。你可以粗略理解为：

英文：1 个 Token ≈ 0.75 个单词（约 4 个字符）
中文：1 个 Token ≈ 1 个汉字（不同模型有差异）

示例："Hello, world!"→ 约 3-4 个 Token
示例："今天天气很好"→ 约 6 个 Token

2. Context Window（上下文窗口）

Context Window 是模型一次能"记住"的最大文本量。

它包含了你发送的提示词（输入）加上模型生成的回复（输出）。常见模型的 Context Window：

模型	Context Window	约等于
GPT-5.4	128,000 tokens	约 96,000 个中文字
Claude Sonnet 4	200,000 tokens	约 150,000 个中文字
Gemini 2.0 Flash	1,000,000+ tokens	约 750,000 个中文字
Qwen-Max	32,000 tokens	约 24,000 个中文字
ERNIE 4.0	7,000-21,000 tokens	约 5,000-15,000 个中文字

3. Temperature（温度）

Temperature 控制生成内容的随机性和创造性。

Temperature = 0：确定性最高，相同输入总是得到相同输出。适合：数据提取、分类、代码生成
Temperature = 0.3-0.7：平衡创造性和准确性。适合：一般对话、文案撰写
Temperature = 0.8-1.0：创造性最高，输出更随机。适合：创意写作、头脑风暴

4. Top-P（核采样）

Top-P 是另一种控制生成多样性的参数。

实用建议：通常只需要调整 Temperature，Top-P 保持 0.9 或 1.0 即可。两者不建议同时调整。

5. System Prompt（系统提示词）

System Prompt 是设定模型"角色"和"行为准则"的指令。

6. Stream（流式输出）

流式输出让模型逐字返回结果，而不是等全部生成完才返回。

API 调用的通用流程

1. 注册账号 → 2. 获取 API Key → 3. 安装 SDK → 4. 编写代码 → 5. 发起请求 → 6. 处理响应

三、OpenAI GPT 系列 API

全球最流行的 AI 模型 API

OpenAI 是第一个将大语言模型 API 商业化的公司。它的生态最成熟、文档最完善、社区最大。如果你只能学一个平台的 API，选 OpenAI 准没错。

1. 注册流程

步骤 1：访问 platform.openai.com

步骤 2：点击 "Sign Up"，支持 Google / Apple / Microsoft 账号登录或邮箱注册

步骤 3：验证邮箱地址

步骤 4：创建 API Key → Settings → API Keys → "Create new secret key"

⚠️ API Key 只在创建时显示一次，请务必立即保存！

2. Python 调用示例

# 安装：pip install openai import os from openai import OpenAI client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY")) response = client.chat.completions.create( model="gpt-5.4-mini", messages=[ {"role": "system", "content": "你是一个有帮助的助手。"}, {"role": "user", "content": "用一句话解释什么是人工智能。"} ], temperature=0.7, max_tokens=100, ) print(response.choices[0].message.content)

3. Node.js 调用示例

// 安装：npm install openai import OpenAI from "openai"; const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY, }); async function main() { const response = await openai.chat.completions.create({ model: "gpt-5.4-mini", messages: [ { role: "system", content: "你是一个有帮助的助手。" }, { role: "user", content: "用一句话解释什么是人工智能。" } ], temperature: 0.7, max_tokens: 100, }); console.log(response.choices[0].message.content); } main().catch(console.error);

4. 计费说明

模型	输入价格	输出价格	上下文
GPT-5.4 nano	$0.20/百万 tokens	$1.25/百万 tokens	128K
GPT-5.4 mini	$0.75/百万 tokens	$4.50/百万 tokens	128K
GPT-5.4	$2.50/百万 tokens	$15.00/百万 tokens	128K
o3	$10.00/百万 tokens	$40.00/百万 tokens	200K

5. 速率限制

免费层（Tier 1）：GPT-5.4 mini 约 200 RPM / 40,000-200,000 TPM

付费层（Tier 2+）：500-5,000 RPM / 50,000-800,000 TPM

四、阿里通义千问（Qwen）API

中文能力最强的国产模型

阿里通义千问由阿里巴巴达摩院研发，是国内最早开放的大语言模型之一。它对国内用户非常友好——无需科学上网，注册简单，还有免费额度。

1. 注册流程

步骤 1：访问 dashscope.console.aliyun.com

步骤 2：使用阿里云账号登录（支持手机号注册）

步骤 3：完成实名认证

步骤 4：创建 API Key → "API-KEY 管理" → "创建新的 API-KEY"

2. Python 调用示例（OpenAI 兼容格式）

# 安装：pip install openai from openai import OpenAI client = OpenAI( api_key=os.environ.get("DASHSCOPE_API_KEY"), base_url="https://dashscope.aliyuncs.com/compatible-mode/v1", ) response = client.chat.completions.create( model="qwen-plus", messages=[{"role": "user", "content": "用一句话解释什么是人工智能。"}], temperature=0.7, )

3. 计费说明

模型	输入价格	输出价格	上下文
Qwen-Turbo	免费	免费	8K
Qwen-Plus	¥0.0008/千 tokens	¥0.002/千 tokens	32K
Qwen-Max	¥0.004/千 tokens	¥0.012/千 tokens	8K
Qwen-Long	¥0.0005/千 tokens	¥0.002/千 tokens	10M

五、Anthropic Claude API

代码理解和安全性的标杆

Claude 系列以出色的代码理解能力、安全对齐和长上下文处理能力著称。如果你需要处理复杂代码或文档，Claude 是首选。

1. 注册流程

步骤 1：访问 console.anthropic.com

步骤 2：使用 Google 账号或邮箱注册

步骤 3：创建 API Key → "API Keys" → "Create Key"

2. Python 调用示例

# 安装：pip install anthropic from anthropic import Anthropic client = Anthropic(api_key=os.environ.get("ANTHROPIC_API_KEY")) message = client.messages.create( model="claude-sonnet-4-20250514", max_tokens=1024, messages=[ {"role": "user", "content": "用一句话解释什么是人工智能。"} ], temperature=0.7, ) print(message.content[0].text)

3. 计费说明

模型	输入价格	输出价格	上下文
Claude 3.5 Haiku	$0.80/百万 tokens	$4.00/百万 tokens	200K
Claude Sonnet 4	$3.00/百万 tokens	$15.00/百万 tokens	200K

六、Google Gemini API

免费额度最大的多模态王者

Google Gemini 以多模态能力和超长的 Context Window 著称。它的免费额度是几大平台中最大的，非常适合学习和原型开发。

1. 注册流程

步骤 1：访问 aistudio.google.com

步骤 2：使用 Google 账号一键登录

步骤 3："Get API Key" → "Create API Key in new project"

2. Python 调用示例

# 安装：pip install google-genai from google import genai client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY")) response = client.models.generate_content( model="gemini-2.0-flash", contents="用一句话解释什么是人工智能。" ) print(response.text)

3. 计费说明

模型	免费层	付费层（输入）	付费层（输出）
Gemini 2.0 Flash	15 RPM / 1M tokens/天	$0.10/百万 tokens	$0.40/百万 tokens
Gemini 2.0 Pro	2 RPM	$1.25/百万 tokens	$10.00/百万 tokens

七、百度文心一言 API

国内生态完善的中文大模型

百度文心一言（ERNIE）由百度研发，在中文理解、知识问答等方面表现优异。通过百度智能云千帆平台提供服务。

1. 注册流程

步骤 1：访问 cloud.baidu.com

步骤 2：使用手机号注册百度账号

步骤 3：完成实名认证

步骤 4：进入千帆平台 → 创建应用 → 获取 API Key 和 Secret Key

2. Python 调用示例

# 安装：pip install requests import os import requests def get_access_token(): api_key = os.environ.get("BAIDU_API_KEY") secret_key = os.environ.get("BAIDU_SECRET_KEY") response = requests.post( "https://aip.baidubce.com/oauth/2.0/token", params={ "grant_type": "client_credentials", "client_id": api_key, "client_secret": secret_key, } ) return response.json().get("access_token") def call_ernie(prompt): access_token = get_access_token() url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro?access_token={access_token}" response = requests.post(url, json={ "messages": [{"role": "user", "content": prompt}], "temperature": 0.7, }, headers={"Content-Type": "application/json"}) return response.json().get("result", "")

3. 计费说明

模型	输入价格	输出价格	上下文
ERNIE Speed	¥0.0008/千 tokens	¥0.002/千 tokens	7K
ERNIE Lite	免费	免费	7K
ERNIE 4.0	¥0.03/千 tokens	¥0.09/千 tokens	7K
ERNIE 4.0 Turbo	¥0.008/千 tokens	¥0.024/千 tokens	128K

八、通用最佳实践

让你的 API 调用更稳定、更安全、更省钱

1. 错误处理与重试机制

错误类型	HTTP 状态码	处理方式
网络超时	-	自动重试
速率限制	429	等待后重试
服务器错误	500/502/503	等待后重试
认证失败	401	检查 Key
参数错误	400	检查代码

指数退避重试策略（Python）

import time, random def chat_with_retry(client, messages, max_retries=3, base_delay=1.0): for attempt in range(max_retries): try: response = client.chat.completions.create( model="gpt-5.4-mini", messages=messages ) return response.choices[0].message.content except RateLimitError: if attempt == max_retries - 1: raise delay = (base_delay * (2 ** attempt)) + random.uniform(0, 1) time.sleep(delay)

2. API Key 安全管理

使用环境变量存储 API Key
使用 .env 文件 + .gitignore
生产环境使用密钥管理服务
定期轮换 API Key

3. 成本控制技巧

策略	说明	节省效果
选择合适的模型	简单任务用 mini/flash 模型	50-90%
精简提示词	删除不必要的上下文	10-30%
控制 max_tokens	限制最大输出长度	20-50%
缓存重复结果	相同的提示词只调用一次	30-70%
使用免费额度	各平台的免费额度先用起来	100%

九、快速参考表

各平台核心数据一目了然

特性	OpenAI	通义千问	Claude	Gemini	文心一言
注册门槛	中	低	高	低	低
代表模型	GPT-5.4	Qwen-Plus	Sonnet 4	Gemini 2.0	ERNIE 4.0
最大上下文	128K	32K	200K	1M+	7K-21K
流式输出	✅	✅	✅	✅	✅
Python SDK	openai	dashscope	anthropic	google-genai	requests
Node.js SDK	openai	openai 兼容	@anthropic-ai/sdk	@google/genai	axios

SDK 安装命令速查

# Python pip install openai # OpenAI pip install dashscope # 通义千问 pip install anthropic # Claude pip install google-genai # Gemini pip install requests # 文心一言 # Node.js npm install openai # OpenAI / 通义千问 npm install @anthropic-ai/sdk # Claude npm install @google/genai # Gemini npm install axios # 文心一言

十、总结

关键要点回顾

五大主流平台（OpenAI、通义千问、Claude、Gemini、文心一言）的完整注册和调用流程
Python 和 Node.js 双语言调用示例，包含错误处理和流式输出
计费规则和速率限制，帮你控制成本避免踩坑
通用最佳实践，写出生产级的 API 调用代码

如何选择适合你的 API？

场景	推荐	理由
国内用户	通义千问 / 文心一言	国内访问快，中文能力强
国际用户	OpenAI / Claude	生态成熟，全球覆盖
代码能力	Claude	代码理解出色
多模态	Gemini	原生多模态支持
预算有限	Gemini 免费层 + 通义千问	免费额度最大