当前位置: 首页 > news >正文

GPT-5.5 和 Codex 正式登陆 Bedrock:接入全流程 + Codex 配置实战

GPT-5.5 和 Codex 正式登陆 Bedrock:接入全流程 + Codex 配置实战

OpenAI 的模型终于能在亚马逊云科技上跑了。

6 月 1 日,GPT-5.5、GPT-5.4 和 Codex 正式在 Amazon Bedrock 上线(GA),不是 Preview,直接可以用于生产。对于已经在用 Bedrock 的团队来说,这意味着不需要再单独维护一套 OpenAI 的 API Key 管理、计费对账、数据合规流程——直接走 Bedrock 统一入口,用量还能抵扣 AWS 承诺消费。

为什么这事值得关注

之前用 OpenAI 模型有几个痛点:

  1. API Key 散落各处 —— 每个项目组自己申请、自己管 key,安全团队管不过来
  2. 计费不透明 —— OpenAI 账单和 AWS 账单是两套,做 FinOps 归因很麻烦
  3. 数据合规顾虑 —— 数据送去 OpenAI 服务器,和你选的 AWS Region 没关系
  4. 无法复用现有治理 —— IAM 策略、VPC 端点、CloudTrail 审计这些全用不上

现在这些问题一次性解决了:

  • 推理在你选择的 Bedrock Region 内完成
  • 用 IAM 做权限控制
  • CloudTrail 记录每一次调用
  • 账单直接进 AWS Cost Explorer
  • 用量算入现有 AWS 承诺消费(EDP/PPA)

能用哪些模型

模型 Model ID 特点
GPT-5.5 openai.gpt-5.5 顶配,agentic coding + 复杂推理
GPT-5.4 openai.gpt-5.4 性价比,日常任务够用
GPT-OSS-120B openai.gpt-oss-120b 开源大模型
GPT-OSS-20B openai.gpt-oss-20b 轻量开源
Codex 通过 Codex App/CLI AI 编码 agent

定价和 OpenAI 官方一致,按 token 计费,没有 seat license。

快速接入:Python 调用 GPT-5.5

1. 获取 Bedrock API Key

在 Bedrock 控制台生成 API Key(这是新推出的认证方式,简化了 SDK 集成)。

2. 安装 OpenAI SDK

pip install -U openai

对,你没看错——用的是 OpenAI 官方 SDK,只是把 base_url 指向 Bedrock 的端点。

3. 设置环境变量

export OPENAI_BASE_URL="https://bedrock-mantle.us-east-2.api.aws/openai/v1"
export OPENAI_API_KEY="<你的 Bedrock API Key>"
export BEDROCK_OPENAI_MODEL_ID="openai.gpt-5.5"

4. 调用代码

import os
from openai import OpenAIclient = OpenAI(base_url=os.environ["OPENAI_BASE_URL"],api_key=os.environ["OPENAI_API_KEY"],
)response = client.responses.create(model=os.environ["BEDROCK_OPENAI_MODEL_ID"],input=[{"role": "developer","content": "你是一个 AWS 架构师,回答简洁实用。",},{"role": "user","content": "设计一个支持 10 万 QPS 的多区域架构方案",},],reasoning={"effort": "medium"},text={"verbosity": "low"},
)print(response.output_text)

几个注意点:

  • 用的是 responses.create(Responses API),不是老版的 chat.completions.create
  • reasoning 参数控制推理深度:low/medium/high
  • role: "developer" 对应以前的 system prompt

5. curl 也能直接调

curl "$OPENAI_BASE_URL/responses" \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{"model": "openai.gpt-5.5","input": [{"role": "developer", "content": "你是一个 AWS 架构师。"},{"role": "user", "content": "Lambda 冷启动怎么优化?"}],"reasoning": {"effort": "low"},"text": {"verbosity": "low"}}'

Codex 配置:让 AI 编码 agent 走 Bedrock 推理

Codex 是 OpenAI 的代码 agent——每周有 400 多万开发者在用。现在可以配置 Codex 把推理请求发到 Bedrock,数据不出你的 AWS 区域。

支持的客户端

  • Codex App(桌面端)
  • Codex CLI(命令行)
  • VS Code 扩展
  • JetBrains 插件
  • Xcode 集成

配置步骤

方式一:Bedrock API Key(推荐,简单)

# 设置环境变量
export AWS_BEARER_TOKEN_BEDROCK="<你的 Bedrock API Key>"

然后编辑 ~/.codex/config.toml

model = "openai.gpt-5.5"
model_provider = "amazon-bedrock"[model_providers.amazon-bedrock.aws]
region = "us-east-2"

方式二:AWS SDK 凭证链(适合已有 IAM 配置的团队)

如果不设 AWS_BEARER_TOKEN_BEDROCK,Codex 会自动 fallback 到 AWS SDK 凭证链(环境变量 → profile → EC2 实例角色),和你用 boto3 的逻辑一样。

配置完重启 Codex App 或 VS Code 扩展即可生效。

实际使用感受

跑了几天下来的体感:

  1. 延迟:GPT-5.5 推理速度比较快(OpenAI 标注为 "fast"),首 token 响应 ~1 秒左右
  2. 兼容性:现有的 OpenAI SDK 代码几乎不用改,换个 base_url 就行
  3. Codex 体验:跑大型项目的重构任务很流畅,后台跑完推送结果
  4. 计费:直接在 Bedrock 的 Usage 面板看,和 Claude 的用量放一起

和直接用 OpenAI API 的区别

维度 直接 OpenAI Bedrock 上的 OpenAI
认证 OpenAI API Key IAM / Bedrock API Key
数据位置 OpenAI 选择的服务器 你选的 AWS Region 内
审计 CloudTrail 全量记录
计费 OpenAI 独立账单 AWS 统一账单
承诺消费 不算 算入 EDP/PPA
Guardrails 不能用 可以加 Bedrock Guardrails
网络隔离 公网 支持 VPC Endpoint

适合什么团队

建议迁移过来的:

  • 已有 AWS 承诺消费的企业(用量能抵扣)
  • 对数据驻留有合规要求的行业(金融、医疗、政府)
  • 多模型混用的团队(Claude + GPT 同一入口管理)
  • 安全团队要求统一审计的组织

可以暂时不动的:

  • 个人开发者、小项目(OpenAI 直连更简单)
  • 只用 GPT 不用 AWS 其他服务的纯 AI 应用

踩坑备忘

  1. Responses API 是必须的 —— Bedrock 上的 OpenAI 模型走 Responses API,不支持老版 Chat Completions API。如果代码里还在用 chat.completions.create,需要迁移
  2. 模型名不要带版本号 —— 用 openai.gpt-5.5 不是 gpt-5.5-2026xxxx
  3. 区域选择 —— 目前不是所有区域都支持,建议用 us-east-2。具体看官方区域兼容性文档
  4. Codex 桌面端环境变量 —— 放 ~/.codex/.env 里,不是系统环境变量

总结

GPT-5.5 上 Bedrock 对企业用户来说是个好消息——终于不用在"想用 OpenAI 模型"和"数据合规 + 统一治理"之间做选择了。Codex 的 Bedrock 集成也很丝滑,改个配置文件就搞定。

如果你团队已经在用 Bedrock 跑 Claude,加个 GPT-5.5 就是改一行 model ID 的事。试试 Responses API,体验下新的调用方式。

官方资源:

  • 入门博客:https://aws.amazon.com/blogs/aws/get-started-with-openai-gpt-5-5-gpt-5-4-models-and-codex-on-amazon-bedrock
  • 区域兼容性:https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html
  • Codex + Bedrock 配置:https://docs.aws.amazon.com/bedrock/latest/userguide/model-cards-openai.html
http://www.jsqmd.com/news/1018971/

相关文章:

  • 鸿蒙脑洞大开麦:从意念控轮椅到AI一键造应用,揭秘鸿蒙生态的创意生长样本
  • AI 智能电动行李箱智能功率 MOSFET 完整选型方案
  • 模型剪枝与知识蒸馏:压缩大模型的两种路径与工程取舍
  • 渔人的直感:FF14钓鱼计时器终极配置指南
  • Linux 网络接口配置命令完整使用指南
  • Axios 0.21 vs 1.2:你的POST请求为啥突然变FormData了?手把手排查与修复
  • 别再只盯着能耗了!2023顶会SNN论文揭示的三大新趋势:动态结构、联合训练与脉冲Transformer
  • 携号转网查询接口哪家好?2026 服务商技术选型与接入指南
  • Ohook:解锁Microsoft 365完整功能的开源钩子技术方案
  • 2026年6月枣庄口碑好的无损漏水精准定位机构靠谱推荐榜,暗管/消防/地暖/外墙/屋顶漏水检测服务商选型指南 - 资讯热点
  • 避坑指南:选内衬不锈钢复合管厂家要避开这5个坑 - 信息热点
  • 天猫流量转化实战专家/机构测评榜单选型(2026中立客观版) - 品牌2026推荐
  • Grok 复制内容带井号(#)怎么办?试试 AI 导出鸭,快速剔除井号,修复复制导出异常问题
  • MPC866时钟与总线接口配置:从原理到实战的嵌入式系统核心设计
  • 如何高效提升Typora编辑体验:3个实用橙心主题配置技巧指南
  • 题解:洛谷 P3388 割点
  • Linux 达梦数据库(DM8)超详细全流程手册(生产级 / 嵌入式 / GIS 开发专属)
  • 3步彻底解决macOS应用卸载残留问题:Pearcleaner如何释放30%磁盘空间
  • 【Zephyr开发系列-7】Zephyr程序调试解析
  • VLE指令集:嵌入式处理器代码密度优化原理与应用
  • 别再走弯路!2026实测靠谱的AI论文平台|避坑版
  • 2026谷歌流量转化操盘手测评榜单|中立选型指南(去营销化) - 品牌2026推荐
  • VLE指令集:嵌入式开发中的代码密度优化与混合编码实践
  • LLM-Mixer:面向多尺度时间序列的混合感知大模型架构
  • 一体化污水处理设备技术解析与合规落地指南 - 奔跑123
  • USB-Disk-Ejector:Windows设备安全弹出终极解决方案,告别繁琐操作!
  • 旧衣回收小程序开发攻略
  • Prompt工程从入门到进阶!基于通义千问实战零样本/少样本/CoT/攻防防范(附完整代码)
  • 打造个人飞行雷达:dump1090 ADS-B信号解码全攻略
  • DataWorks新手避坑指南:ODPS SQL执行报错的8个常见原因与修复方法