当前位置: 首页 > news >正文

企业级 Agent 在 K8s 上的运行模型

企业级 Agent 在 K8s 上的运行模型

—— 多 Agent + Graph 工作流的云原生落地实践

一句话结论先给出: Agent 不是一个 Pod,Agent 是一套运行模型; Kubernetes 不是“部署环境”,而是 Agent 的调度与治理中枢。


一、为什么 Agent 一定要跑在 Kubernetes 上?

在 Demo 阶段,你可能是:

  • 本地跑 Spring Boot
  • 一个 JVM 里执行所有 Agent
  • 没有并发控制、没有资源隔离

但一旦进入企业场景,问题会立刻出现:

问题单体 Agent 的困境
并发Agent 之间相互阻塞
资源LLM / Tool 调用不可控
稳定性一个 Agent OOM 拖垮整体
扩展无法按 Agent 类型扩容
治理无法限流、熔断、回滚

👉 K8s 提供的不是“部署”,而是:调度、隔离、弹性、治理能力。


二、企业级 Agent 的 K8s 分层运行模型(核心)

2.1 推荐的四层模型

┌──────────────────────────┐ │ API Gateway │ │ 鉴权 / 限流 / 路由 │ └───────────┬──────────────┘ │ ┌───────────▼──────────────┐ │ Agent Orchestrator │ ← Graph / Workflow / 状态机 │ (控制面 Control Plane)│ └───────────┬──────────────┘ │ ┌───────────▼──────────────┐ │ Agent Runtime Pods │ ← 执行面 Data Plane │ (LLM / Tool / Logic) │ └───────────┬──────────────┘ │ ┌───────────▼──────────────┐ │ Infra & Observability │ │ Redis / DB / Prometheus │ └──────────────────────────┘

👉 这是“可规模化 Agent 系统”的最低结构。


三、Agent 在 K8s 中的三种部署形态(非常关键)

3.1 形态一:单体 Agent Runtime(不推荐生产)

1 Pod = 所有 Agent

问题

  • 无法独立扩缩容
  • Agent 相互影响
  • 无法精细治理

只适合 POC / 内部试验


3.2 形态二:按 Agent 类型拆分 Pod(推荐)

analyze-agent-service plan-agent-service execute-agent-service validate-agent-service

每个 Agent:

  • 一个 Deployment
  • 独立副本数
  • 独立资源限制
resources: requests: cpu
http://www.jsqmd.com/news/343026/

相关文章:

  • 【计算机毕业设计案例】基于python+Hadoop的国家气象降雨量大数据分析系统基于hadoop的气象数据分析与可视化系统(程序+文档+讲解+定制)
  • SpringCloud从入门到上天:Nacos做微服务注册中心
  • 来自 Nimbus-7 SMMR 和 DMSP SSM/I-SSMIS 被动微波数据的海冰浓度 V002
  • 高校物业维修管理微信小程序的设计和实现
  • MySQL 5.7 转 Oracle 实习生核心注意事项(企业常见场景)
  • D.二分查找-二分答案-求最小——1870. 准时到达的列车最小时速
  • 从入门到精通:Boris Cherny 亲测的 Claude Code 十大高级技巧 + 插件实操(万字详解)
  • 大数据毕设项目推荐-基于hadoop的气象数据分析与可视化系统基于python+Hadoop的国家气象降雨量大数据分析系统【附源码+文档,调试定制服务】
  • axios和jsdom的碰撞
  • 计算机大数据毕设实战-基于python+Hadoop的国家气象降雨量大数据分析系统气象数据可视化平台【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 8-4 WPS JS宏 new RegExp()、test()、exec()正则表达式的创建与使用
  • 【课程设计/毕业设计】基于大数据的多维度气象数据的可视化分析系统基于python+Hadoop的国家气象降雨量大数据分析系统【附源码、数据库、万字文档】
  • 基于STM32F103驱动QMI8658A输出加速度陀螺仪数据
  • JVM面试必背专题(2026最新版):从基础到高版本,一文吃透所有核心考点
  • 【无人机协同路径规划】基于六种最新优化算法(CCO、TOC、MSO、DOA、GOA、OX)求解多个无人机协同路径规划,可以自定义无人机数量及起始点附Matlab代码
  • 【课程设计/毕业设计】基于Hadoop的某篮球队各个球员数据分析数据可视化系统实现【附源码、数据库、万字文档】
  • 【开题答辩全过程】以 工业车辆维修APP设计与实现为例,包含答辩的问题和答案
  • 数据库全解析:从关系型到向量数据库,LLM 开发中的选型指南
  • 计算机毕业设计springboot任我听——音乐推荐系统的开发 基于 SpringBoot 的 “随心听” 个性化音乐推荐平台开发 SpringBoot 框架下智能音乐推荐系统 “乐伴听” 的设计
  • 大数据计算机毕设之基于python+Hadoop的国家气象降雨量大数据分析系统基于大数据的多维度气象数据的可视化分析系统(完整前后端代码+说明文档+LW,调试定制等)
  • 计算机大数据毕设实战-基于Hadoop的某篮球队各个球员数据分析系统的设计与实现【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 计算机毕业设计springboot基于的药品管理系统的设计与实现 基于 SpringBoot 框架的医药库存管理系统设计与实现 SpringBoot 技术下的药品进销存管理系统开发与应用
  • 来数独 - LaiSudo
  • 人形机器人日报|摩根士丹利预测2026年销量暴涨133%,中国供应链领跑全球
  • 基于Springboot+Vue的校园设备维护报修系统源码文档部署文档代码讲解等
  • C++游戏开发之旅 8
  • 【开题答辩全过程】以 基于Springboot个人健康运动系统的设计与实现为例,包含答辩的问题和答案
  • 大数据计算机毕设之基于Hadoop的某篮球队各个球员数据分析系统的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • AI大模型应用开发学习路线:从后端转型到AI开发,2026最新!
  • 【毕业设计】基于Hadoop的某篮球队各个球员数据分析系统的设计与实现(源码+文档+远程调试,全bao定制等)