当前位置: 首页 > news >正文

Cloudflare打造统一推理层:一个API访问多供应商模型,快速可靠助力智能体开发!

Cloudflare人工智能平台:统一推理层,为智能体提供快速、可靠模型访问!

2026年4月16日,Cloudflare正将自身打造成一个统一的推理层,通过一个API就能访问任何供应商的任何人工智能模型,并且具备快速、可靠的特性。

人工智能模型更新速度极快,实际应用场景通常需调用多个模型。构建人工智能应用,尤其是智能体时,会面临需访问所有模型、避免过度依赖单一供应商、监控成本、确保可靠性和管理延迟等挑战。

自推出AI Gateway和Workers AI后,开发者在Cloudflare上构建人工智能应用的热情高涨。过去几个月,Cloudflare更新了仪表盘,增加零设置默认网关、上游故障自动重试功能,以及更精细的日志控制。

一个目录,一个统一端点

从今天起,可使用用于Workers AI的相同 `AI.run()` 绑定来调用第三方模型。使用Workers的用户,从Cloudflare托管的模型切换到OpenAI、Anthropic或其他供应商的模型,只需修改一行代码。

const response = await env.AI.run('anthropic/claude-opus-4-6', {
input: 'What is Cloudflare?',
}, {
gateway: { id: "default" },
});

不使用Workers的用户,未来几周内将推出REST API支持,可在任何环境中访问完整的模型目录。现在可通过一个API、一行代码切换模型以及一组信用额度来支付费用,访问来自12家以上供应商的70多个模型,且目录还在快速扩展。可浏览[模型目录](https://developers.cloudflare.com/ai/models),为用例找到合适模型,模型供应扩展到包括图像、视频和语音模型,以构建多模态应用。通过一个API访问所有模型,能在一个地方管理所有人工智能支出,还可通过在请求中包含自定义元数据细分成本。

const response = await env.AI.run('@cf/moonshotai/kimi-k2.5',
{
prompt: 'What is AI Gateway?'
},
{
metadata: { "teamId": "AI", "userId": 12345 }
}
);

自带模型

AI Gateway可让用户通过一个API访问所有供应商的模型,但有时用户需要运行基于自己的数据进行微调的模型,或针对特定用例进行优化的模型。Cloudflare正努力让用户能够将自己的模型引入Workers AI,利用Replicate的 [Cog](https://cog.run/) 技术帮助用户将机器学习模型容器化。

`cog.yaml` 文件示例:

build:
python_version: "3.13"
python_requirements: requirements.txt
predict: "predict.py:Predictor"

[`predict.py`](http://predict.py) 文件示例:

from cog import BasePredictor, Path, Input
import torch

class Predictor(BasePredictor):
def setup(self):
"""Load the model into memory to make running multiple predictions efficient"""
self.net = torch.load("weights.pth")

def predict(self,
image: Path = Input(description="Image to enlarge"),
scale: float = Input(description="Factor to scale image by", default=1.5)
) -> Path:
"""Run a single prediction on the model"""
# ... pre-processing ...
output = self.net(input)
# ... post-processing ...
return output

用户可运行 `cog build` 构建容器镜像,并将Cog容器推送到Workers AI,Cloudflare将为用户部署和提供模型,用户可通过常用的Workers AI API访问。Cloudflare正在进行一些大型项目,让更多客户能使用这一功能,已在内部团队和一些外部客户中测试,有兴趣成为设计合作伙伴可联系。很快,任何人都可打包自己的模型并通过Workers AI使用。

快速获取首个令牌

构建实时智能体时,结合使用Workers AI模型和AI Gateway特别强大。用户对速度的感知取决于获取首个令牌的时间,Cloudflare在全球330个城市的数据中心网络,使AI Gateway与用户和推理端点距离近,将流式传输开始前的网络时间降至最低。Workers AI在其公共目录中托管了开源模型,包括专门为智能体设计的大型模型和实时语音模型,通过AI Gateway调用这些Cloudflare托管的模型,代码和推理在同一全球网络上运行,无需额外通过公共互联网,能让智能体实现最低的延迟。

具备自动故障转移的可靠性设计

构建智能体时,可靠性和速度同样重要。智能体工作流程中的每一步都依赖于前面的步骤,可靠的推理至关重要。通过AI Gateway,若调用的模型在多个供应商处都有提供,其中一个供应商出现故障,会自动将请求路由到另一个可用的供应商,无需编写故障转移逻辑。使用 [Agents SDK构建长时间运行的智能体](https://blog.cloudflare.com/project-think/),流式推理调用在断开连接时能保持弹性,AI Gateway会在流式响应生成时对其进行缓冲,与智能体的生命周期无关。若智能体在推理过程中中断,可重新连接到AI Gateway并获取响应,无需重新进行推理调用或为相同的输出令牌支付两次费用,结合Agents SDK内置的检查点功能,最终用户不会察觉到任何异常。

Replicate

Replicate团队已正式[加入](https://blog.cloudflare.com/replicate-joins-cloudflare/)Cloudflare的人工智能平台团队,双方一直在努力进行Replicate与Cloudflare的集成工作,包括将所有Replicate模型引入AI Gateway,并将托管模型迁移到Cloudflare基础设施上。很快,用户就可以通过AI Gateway访问在Replicate上喜欢的模型,也能将在Replicate上部署的模型托管到Workers AI上。

开始使用

要开始使用,可查看关于 [AI Gateway](https://developers.cloudflare.com/ai-gateway) 或 [Workers AI](https://developers.cloudflare.com/workers-ai/) 的文档。通过 [Agents SDK](https://developers.cloudflare.com/agents/) 了解更多关于在Cloudflare上构建智能体的信息。

在Cloudflare TV观看

Cloudflare的连接云可以保护[整个企业网络](https://www.cloudflare.com/network-services/),帮助客户[高效构建互联网规模的应用](https://workers.cloudflare.com/),加速任何[网站或互联网应用](https://www.cloudflare.com/performance/accelerate-internet-applications/),[抵御DDoS攻击](https://www.cloudflare.com/ddos/),[防范黑客](https://www.cloudflare.com/application-security/),并能帮助用户[迈向零信任](https://www.cloudflare.com/products/zero-trust/)。从任何设备访问 [1.1.1.1](https://one.one.one.one/),即可开始使用免费应用,让网络更快速、更安全。若想了解构建更美好互联网的使命,可[从这里开始](https://www.cloudflare.com/learning/what-is-cloudflare/)。若正在寻找新的职业方向,可查看 [招聘信息](https://www.cloudflare.com/careers)。

相关文章:

  • 2026年4月16日,[构建运行超大型语言模型的基础](/high-performance-llms/),作者:Michelle Chen、Kevin Flansburg、Vlad Krasnov。
  • 2026年4月16日,[人工智能搜索:智能体的搜索原语](/ai-search-agent-primitive/),作者:Gabriel Massadas、Miguel Cardoso、Anni Wang。
  • 2026年4月16日,[使用PlanetScale + Workers部署Postgres和MySQL数据库](/deploy-planetscale-postgres-with-workers/),作者:Vy Ton、Matt Silverlock。
  • 2026年4月16日,[工件:支持Git的版本化存储](/artifacts-git-for-agents-beta/),作者:Dillon Mulroy、Matt Carey、Matt Silverlock。

入门指南:

  • [免费计划](https://www.cloudflare.com/plans/free/)
  • [企业版](https://www.cloudflare.com/enterprise/)
  • [比较计划](https://www.cloudflare.com/plans/)
  • [获取推荐](https://www.cloudflare.com/about-your-website/)
  • [申请演示](https://www.cloudflare.com/plans/enterprise/demo)
http://www.jsqmd.com/news/655862/

相关文章:

  • 探讨有实力的耐酸碱覆膜机胶辊厂家,为你揭秘靠谱供应商 - myqiye
  • 2026年华东、华中、华南热力工程与保温管道系统一体化服务商选择指南(含官方联系方式 - 精选优质企业推荐官
  • Qt5.14.2静态编译实战:如何为你的小工具生成一个“绿色单文件exe”?
  • Spotify广告拦截终极指南:BlockTheSpot如何让你免费享受纯净音乐体验
  • video-compare:帧级同步的视觉差分引擎
  • Windows平台C++项目集成Glog日志库:从编译到实战配置详解
  • TinyVue 3.30 重磅发布:OpenTiny 引领企业级 UI 组件库新潮流
  • Qt浏览器开发进阶:CEF核心类深度解析与QCefView实战应用
  • 深度解析gprMax:如何用FDTD方法实现精准地质雷达仿真
  • 耐磨耐刮的覆膜机胶辊品牌哪家好,优质厂家大汇总 - mypinpai
  • 新手也能搞定!用立创EDA从原理图到PCB,手把手教你画STM32F103双摇杆遥控器板子
  • 如何快速实现文档转换:面向团队的完整指南
  • 回收大润发购物卡:你需要知道的回收技巧和注意事项 - 团团收购物卡回收
  • 探寻江苏羿润环境工程技术有限公司石灰粉选粉机,口碑究竟怎么样 - 工业设备
  • LGTV Companion:如何让LG电视与Windows电脑实现智能联动自动化?
  • 徐州GEO渠道怎么收费,盘点各渠道价格与服务特色 - 工业品牌热点
  • 环保设备行业销售管理数字化实践与零代码案例总结 - 搭贝
  • OpenCV相机标定实战避坑:从打印棋盘格到误差分析,我的完整踩坑记录与解决方案
  • 2026年华东华中供热管网保温管道系统选型与节能技术应用(含官方联系方式) - 精选优质企业推荐官
  • 2026届学术党必备的AI辅助写作平台解析与推荐
  • 微服务技术选型:Dubbo、Spring Cloud与Spring Cloud Alibaba深度对比
  • 有实力的石灰粉选粉机品牌探讨,江苏羿润环境工程技术有限公司技术创新能力揭秘 - 工业品网
  • 2026年华东、华中、华南热力工程蒸汽管道系统一体化解决方案全景指南(含官方联系方式) - 精选优质企业推荐官
  • SAP PP实战解析:用户状态(User Status)的进阶应用与订单分割中的成本收集器
  • 分享徐州GEO公司口碑榜,专业源头公司推荐哪家 - 工业推荐榜
  • 2026多功能上粉机 油炸机 蒸烤机食品设备厂家实力排行 - 资讯焦点
  • 思源宋体CN:7种字重免费开源字体终极使用指南
  • 从原理到实战:基于C语言构建一个简易NTP客户端
  • 从零到一:手把手教你用EOSIO搭建自己的私有公链(附区块浏览器和钱包APP源码)
  • ST-LINK连接STM8的玄学问题排查:从硬件接线到软件配置的完整解决方案