当前位置: 首页 > news >正文

Build 2026:Azure API Management 推出统一模型 API 并新增 MCP 内容安全能力

微软在 Build 2026 开发者大会上宣布,将全面增强 Azure API Management 的 AI 网关能力。本次主要新增能力如下:一是推出统一模型 API(Unified Model API),客户端仅需使用一种 API 格式,Azure API Management 即可自动将请求适配为各类后端服务商对应的格式;二是 AI 网关现已支持接入 Anthropic 和 Google Vertex AI 旗下模型;三是内容安全策略升级,防护范围拓展至 MCP 工具调用以及智能体间(A2A)通信,与原有大语言模型流量一并纳入保护。
相较于为智能体单独搭建专属治理平台,Azure API Management 可帮助企业将成熟的 API 治理规则直接沿用至新兴的智能体生态体系中。
统一模型 API 现已进入公开预览阶段,解决了企业团队日益突出的运营痛点——随着团队越来越多地混合使用 OpenAI、Anthropic、Google 等提供商的模型(基于性能、成本、延迟或区域需求方面的考虑),每个提供商暴露的 API 格式各不相同。统一模型 API 让客户端可以统一采用一种格式(目前为 OpenAI Chat Completions),APIM 会透明地将请求转换为后端提供商的原生格式,无论是 Anthropic Messages API 还是其他模式。团队可以更换后端提供商、添加新模型或在不同提供商之间路由流量,都无需修改客户端代码。
这不仅仅是一个简单的功能适配层。将模型访问统一接入单一 API 接口后,无论由哪家服务商执行推理,所有治理策略、限流规则、内容安全检测与令牌用量统计都可统一生效。已经使用 APIM 进行传统 API 治理的组织可以将相同的模式延伸至 AI 工作负载,无需额外引入独立的治理体系。
内容安全能力向 MCP 与 A2A 场景延伸是本次架构层的 llm-content-safety 策略原本用于对照 Azure Content Safety 扫描 LLM 请求和响应内容,现在已同步覆盖 MCP 工具调用参数、MCP 响应文本以及 A2A 智能体交互载荷。同时,该策略包含两层独立安全防护:分类内容过滤,针对仇恨、自残、色情、暴力四类内容进行管控,支持设置风险等级阈值,范围为 0(最严格)至 7(最宽松);独立的 shield-prompt 属性,用于识别对抗性提示词注入攻击。典型配置示例如下:<llm-content-safety backend-id="content-safety-backend" shield-prompt="true" enforce-on-completions="true">
<categories output-type="EightSeverityLevels">
<category name="Hate" threshold="4" />
<category name="Violence" threshold="4" />
</categories>
</llm-content-safety>
团队需要注意的一个实现细节,即该策略在流式响应中的行为有所不同。在非流式模式下,一旦检测到违规内容,系统会直接返回 403 状态码。在流式模式下,策略会在滑动窗口中缓冲事件,并直接停止向客户端转发后续事件,且不会返回错误信息。因此,使用流式补全能力的智能体需适配这种内容中断的情况,不能依赖错误码做判断。两个新增的属性 window-size 和 window-overlap-size 可用于调整超长内容的拆分规则,适配 Azure 内容安全服务 10000 字符的评估上限。
词元统计指标已进行了升级,适配多提供商的使用场景。APIM 现在会将推理词元、缓存词元和音频词元记录到 Application Insights,支持 OpenAI Chat Completions、OpenAI Responses 和 Anthropic Messages API 等格式,可监控 Microsoft Foundry、OpenAI、Amazon Bedrock、Google Vertex AI 等多加服务商。对于需要构建成本仪表盘和预算警报的 FinOps 团队来说,扩展后的指标能够反映当前模型的实际行为——推理和缓存消耗了大量早期指标未能捕捉的词元预算。
在资源发现方面,Azure API Center 数据平面 MCP 服务器已正式发布(GA)。它可作为企业统一的资源发现端点:智能体和开发者工具可以通过单个 MCP 连接访问已注册的 MCP 服务器、工具、API、智能体及各类 AI 资产。当团队在 API Center 注册新的 MCP 服务器时,所有已连接的智能体都能自动发现它,无需逐个客户端重新配置。
APIM 现在还支持将已有的 REST API 暴露为 MCP 服务器,这意味着早于智能体时代的企业 API 无需重构即可被智能体调用。结合本次在 Build 大会上正式发布的 Logic Apps MCP 服务器,微软正在构建两条并行路径,帮助企业对接智能体:一条通过 API 网关层(APIM),另一条通过集成平台层(Logic Apps)。
对于正在评估 AI 网关方案的团队来说,www.ntjrcw.com行业竞争态势具有重要参考意义。亚马逊云科技的 Bedrock Guardrails 用于内容过滤和模型访问控制,但暂无产品可对标 APIM 的多厂商统一模型 API,以及针对 MCP、A2A 的全维度内容安全能力。谷歌的 Apigee 已添加一些 AI 网关功能,但尚未达到 APIM 现在覆盖的协议广度。Cloudflare 的 AI Gateway 侧重成本管控与缓存能力,而非多协议治理。APIM 的核心思路是:API 网关(而非全新品类产品)才是承载 AI 工作负载的天然控制平面。

AI 网关能力在所有 APIM 层级中均可用。统一模型 API 处于公开预览阶段。针对 MCP、A2A 的内容安全功能、升级后的词元指标以及 API Center MCP 服务器已正式发布(GA)。AI Gateway 实验室提供 30 多个实操 Jupyter Notebook,包含分步说明和可部署的 Bicep 模板。

http://www.jsqmd.com/news/1000482/

相关文章:

  • RAG+FastAPI构建企业级入职知识中枢
  • 如何挑选正宗无糖新疆特产作为长辈养生礼品?
  • 105秒73个微软官方GitHub仓库消失!攻击者借AI编程工具窃取开发者敏感信息
  • i.MX37嵌入式多媒体处理器:ARM核心与硬件加速的功耗性能平衡术
  • 慢旋转黑洞与暗物质晕相互作用的物理机制与观测效应
  • 2026年深圳家用缝纫机厂家寻找难点及市场观察 - 国麟测评
  • FlicFlac:Windows平台7种音频格式免费转换的终极解决方案
  • 颠覆传统游戏管理:Snap Hutao如何重塑你的原神体验
  • 2026年AI论文平台实测报告:5款神器从文献到降重一站式避坑指南
  • NumPy、SciPy、Pandas、Matplotlib 基础函数用法(Python)
  • 空号检测/空号检测接口/号码状态查询/号码状态查询接口/号码状态查询api/精准实时版/免费试用
  • 5步掌握GetQzonehistory:QQ空间数据备份的终极实战指南
  • 2026年东北防静电地板市场态势:辽宁锦峰装饰材料有限公司的工艺壁垒与价值解析 - 企业推荐官【官方】
  • i.MX535嵌入式处理器深度解析:从Cortex-A8架构到多媒体加速实战
  • 5个关键步骤:用Label Studio构建高效数据标注工作流
  • 深入解析MPC5668G/E汽车MCU:Power架构、双核设计及车载网络实战
  • 实战案例勤策签约柚香谷渠道管理方案
  • 无界鼠标 微软powertoy 小米路由器
  • OpenSSL 4.0.1发布:修复多个高危CVE漏洞,保障系统安全!
  • 5分钟精通专业字体:思源宋体TTF完全使用指南
  • 第 23 篇:如何抓到“正确”的包
  • 美团会员具体有哪些权益,和其他平台会员相比全在哪里?性价比深度对比 - 资讯焦点
  • 3步解锁Mac百度网盘极速下载:开源加速插件终极指南
  • 如何用3个真实故事告诉你:douyin-downloader如何改变内容创作者的工作流
  • 第一行代码第五章读书笔记(1)Fragment
  • Flowable工作流别再直接查act表了!手把手教你设计一张高性能待办已办表
  • 济宁黄金回收避坑干货|正规回收4大标准一看就懂 - 余生黄金回收
  • 2026 厦门包包正规回收:中检鉴定,透明报价 - 奢侈品回收评测
  • Ant Design 6.4.4 发布:多组件问题修复,国际化与 TypeScript 功能优化
  • League Akari:英雄联盟客户端自动化工具箱实战指南