当前位置: 首页 > news >正文

亚马逊云科技推提示词优化工具,助力企业扩展 AI 降本增效!

助力生产环境中扩展 AI 的经济性

分析师称,该工具专注于自动优化提示词,将帮助企业应对运营挑战,特别是在生产环境中扩展生成式 AI 工作负载时面临的成本问题。Avasant 研究总监 Gaurav Dewan 表示:"企业对这类工具的需求是由扩展 AI 时的成本压力和运营复杂性共同驱动的,而非单一因素。"他还指出:"随着企业将生成式 AI 工作负载从实验阶段推向生产阶段,推理成本迅速成为董事会层面关注的问题。当应用大规模运行时,即使提示词效率有适度提升,也能对运营成本产生显著影响。"

这位分析师进一步指出,延迟也正成为一项关键指标,尤其是对于面向客户的 AI 服务而言,响应速度较慢会直接影响用户接受度;提示词优化可以通过更系统地优化质量、延迟和成本,而不是依靠反复试验,在这方面发挥作用。此外,Greyhound Research 首席分析师 Sanchit Vir Gogia 表示,企业对多模型 AI 策略的采用不断增加,也使得对自动提示词优化工具的需求日益增长。他说,随着企业寻求根据成本、性能和治理要求在不同模型之间灵活转移工作负载,多模型的采用正在加速,而提示词优化对于确保应用和工作流能够在不同模型之间切换,同时避免出现行为不一致或性能下降的情况,正变得越来越关键。

超大规模云服务提供商之间竞争加剧

事实上,在企业将生成式 AI 部署投入运营的过程中,并非只有 AWS 着眼于提示词优化。谷歌云(Google Cloud)已在其 Gemini Enterprise Agent Platform 中提供了类似的提示词优化工具,该工具可以使用评估数据集和指标自动优化提示词并在不同模型间进行基准测试;而微软 Azure AI Foundry 则提供了类似的功能,专注于企业 AI 应用的提示词编排、评估管道、变体测试和工作流基准测试。

Gogia 认为,超大规模云服务提供商之间竞争的加剧,反映了一场围绕企业 AI 运营层控制权的更广泛竞争,该运营层负责大规模地评估、监控、治理、优化、迁移、保障和管理 AI 系统。在他看来,AWS 通过将多模型访问与提示词优化、评估、迁移支持和治理功能相结合,将 Amazon Bedrock 定位为这一运营层。同时,Gemini Enterprise Agent Platform(前身为 Google Vertex AI)正在利用其 AI 和分析生态系统,微软 Azure AI 正在将 AI 治理融入企业软件工作流,而 OpenAI 和 Anthropic 则在加强与自身模型生态系统紧密相关的以开发者为中心的评估和提示词工具。他补充说,与此同时,Databricks 和 Snowflake 等平台正在将 AI 可观测性和治理功能更紧密地嵌入企业数据环境,而 LangSmith 等框架和 Promptfoo 等开源工具则吸引着寻求更高可移植性和模型中立性的企业。

http://www.jsqmd.com/news/827626/

相关文章:

  • 告别乱码!手把手教你为ESP8266的TFT屏幕制作专属中文字库(基于TFT_eSPI库)
  • ENVI实战:基于NDWI与决策树的水体信息精准提取
  • B样条曲线:从数学定义到图形绘制的核心原理与实践
  • 告别抓瞎!用Winscope工具精准定位Android车机黑屏闪黑问题(保姆级教程)
  • 知乎API深度解析:构建高效Python数据采集系统的3大核心优势
  • 2026 年国内焊接工作站优质供应商深度测评:从全栈能力到行业深耕,如何科学选型? - 品牌评测官
  • PromptHub:基于Git理念的提示词版本管理与工程化实践
  • Vue3企业级后台管理系统终极指南:5分钟快速搭建完整管理后台
  • 3步搞定B站缓存视频永久保存:m4s-converter无损转换实战指南
  • 如何免费使用draw.io桌面版:跨平台图表绘制的终极指南
  • ColabFold终极指南:15分钟免费预测蛋白质三维结构
  • 保姆级教程:用AMBER的cpptraj分析HIV蛋白酶-抑制剂复合物,从RMSD到氢键一次搞定
  • 用74HC595和74HC165搞定Arduino引脚扩展:手把手教你串并转换与按键扫描
  • 如何在3分钟内实现Rhino到Blender的无缝3D模型导入
  • 你正在找Windows系统修复服务?这4个品牌值得对比 - 资讯速览
  • Windows驱动管理终极指南:Driver Store Explorer完全使用手册
  • 《世毫九本原论》核心章节(CSDN全球首发版权定戳)
  • 构建高可靠Python数据处理流水线的工程实践
  • 番茄小说下载器:3种方法实现离线阅读自由,告别网络限制
  • 忘记压缩包密码怎么办?三步快速找回加密文件的实用指南
  • 开源对话机器人框架Ruuh:模块化设计与工程实践指南
  • 番茄小说下载器:3种方法轻松保存小说,告别网络限制
  • ExtJS ComboBox 实战:从配置优化到动态数据加载的进阶指南
  • 基于MCP协议构建智能科研数据助手:连接ELabFTW与AI大模型
  • Arduino 结合 ADXL335 实现姿态感知与OLED动态显示
  • 5分钟让魔兽争霸3在现代电脑上焕然一新的终极方案
  • 别再死记硬背了!用STM8单片机实战项目(数码管+矩阵键盘)帮你理解期末考点
  • 终极免费激活方案:KMS智能激活工具完全指南
  • 英飞凌 Aurix2G TC3XX GTM 模块实战:从 MCAL 配置到复杂外设联动
  • GPX Studio完整方案:在浏览器中高效编辑GPS轨迹的实战指南