当前位置: 首页 > news >正文

阿里PAI平台使用ESA部署模型滚动更新

阿里PAI平台使用ESA部署模型滚动更新

场景:

阿里PAI平台使用ESA部署模型,vllm部署双卡,双实例

EAS滚动更新配置:

超过期望实例数:{”rolling_strategy.max_surge“:1}

  • 超过期望的实例数(JSON参数:rolling_strategy.max_surge

    • 描述:更新时最多可额外创建的实例数,支持正整数或百分比。值越大,更新越快。
    • 例如:100个实例,配置为20,则更新开始即创建20个新实例。
    • **默认值:**实例总数的2%(不足1时取1)。

    重要

    超过期望的实例数过大时,大量新实例上线后会立即替换等量旧实例,若新实例未预热,突增流量可能冲击服务稳定性。

最大不可用实例数: {“rolling_strategy.max_unavailable”:0}

  • 最大不可用实例数(JSON参数:rolling_strategy.max_unavailable

    • **描述:**更新过程中允许的最大不可用实例数,用于释放资源,防止因资源不足导致更新过程被阻碍。
    • 例如:设为N,更新开始时立即停止N个旧实例。
    • 默认值:
      • 专属资源组:2025年9月1日前创建的服务,默认为1。2025年9月1日后创建的服务,弹性资源池开启默认为0,未开启默认为1。
      • 公共资源组:0。
      • 灵骏智算Quota:2025年9月1日前创建的服务,默认为0。2025年9月1日后创建的服务,默认为实例数的2%(不足1时取1)。

    重要

    • 单实例服务若将最大不可用实例数设为1,滚动更新时旧实例会在新实例启动前退出,期间服务无可用实例,将短暂不可用。
    • 最大不可用实例数过大可能导致过多实例同时下线,剩余实例不足以承载流量,影响服务可用性。

EAS优雅退出配置:

优雅退出时间:{“eas.termination_grace_period”:60}

优雅退出时间(JSON参数:eas.termination_grace_period

  • **描述:**实例优雅退出等待时间,单位秒。实例进入Terminating状态后,流量被摘除,系统等待30秒让其处理完已接收请求后再下线。若请求处理时间较长,建议调大该值。
  • **默认值:**30

是否发送SIGTERM:{“rpc.enable_sigterm”: false}

是否发送SIGTERM(JSON参数:rpc.enable_sigterm

  • **描述:**SIGTERM是终止进程的信号。JSON参数取值true、false。
    • false:实例退出时不会发送SIGTERM信号。
    • true:实例退出时,系统立即发送SIGTERM信号,服务主进程需在信号处理函数中实现自定义优雅退出逻辑,否则可能直接终止,导致优雅退出失败。
  • **默认值:**不发送(false)
http://www.jsqmd.com/news/93552/

相关文章:

  • Qwen3-14B+Function Calling:打通大模型与外部API的关键路径
  • 2025年下半年AI应用架构演进:从RAG到Agent再到MCP的生态跃迁
  • 2025年小型耐火度测定仪/全自动隔热性能测定仪五大靠谱厂家 - mypinpai
  • 大模型智能体开发指南:文件系统如何优化Agent性能!
  • 网络语言系列php系列【仅供参考】:PHP 表达式 Exception::__toString
  • ChatGPT-5.2:人工智能如何走进千家万户,改变我们的每一天
  • 网络语言系列php系列【仅供参考】:PHP Exception::getMessage 和 Exception:: getLine有什么区别
  • 如何在iPhone/iPad上重设iCloud密码
  • Spring AI Alibaba 对话记忆丢失问题:Redis 缓存过期后如何恢复 AI 上下文
  • 2025二手制冷设备回收生产企业TOP5权威推荐:甄选企业助 - myqiye
  • 题解:P11709 「KTSC 2020 R2」魔法转盘
  • FAQ12118:关于修改底色为白色后,设置中菜单字体显示为灰色字体问题(白底黑字)
  • 运维系列数据库系列【仅供参考】:达梦数据库大内存SQL定位和监控
  • Hoppscotch批量编辑完全指南:从基础到精通的高效参数管理
  • 【更新至2024年】2006-2024年上市公司彭博esg评分数据(含细分项)
  • matlab基于词典的稀疏表示高光谱图像分类
  • 20、Java交互与图形编程及DOS系统发展全解析
  • 基控电箱是什么?功能、选型与应用全指南
  • 达尔文12号在哪买:权威榜单与专业选购指南 - 品牌测评家
  • 开源AI新宠LobeChat:支持多模型切换的聊天界面解决方案
  • AutoGPT开源镜像发布:让AI自己完成你的工作目标
  • 闸机租赁源头厂家揭秘,哪家实力最强? - 真知灼见33
  • 步骤详图 教你在linux搭建容器环境
  • PAT 1145 Hashing - Average Search Time
  • Postman接口测试之postman设置接口关联,实现参数化
  • 论文研究内容怎么写?最强技巧让导师直接点头通过
  • 自动化工程:赋能产业升级的核心引擎,从原理到应用全解析
  • AutoGPT在文化遗产数字化保护中的作用探讨
  • Ubuntu20.04安装Miniconda并配置GPU版PyTorch全流程
  • 收藏必备!Agentic RAG:从RAG到Agent的智能进化之路