告别原始命令操作运维,使用自然语言驱动运维 K8S集群、主机、网络设备相关操作
MOM Platform —— 插件化云原生运维管理平台,让运维更简单
前言
作为运维工程师,你是否遇到过这些痛点:
- 🤯 资产分散在 Excel、CMDB、各种云控制台,没有统一管理界面
- 😫 K8s 多集群管理需要频繁切换 kubeconfig,效率低下
- 🔑 SSH 密钥散落各处,每次登录都要找半天
- 📊 老板要运营周报,手动从各系统拼凑数据
- 🤖 想用 AI 辅助运维,自动化运维
如果你也有这些困扰,那MOM Platform可能正是你需要的。
MOM Platform(Multi-platform Operations Manager,多元运维管理平台)是一个开源的插件化运维管理平台,采用 Go + Vue 3 前后端分离架构,支持多集群 K8s 管理、资产管理、多云账号、远程连接、AI 智能运维等功能。
一、核心亮点
🧩 插件化架构 —— 按需加载,灵活扩展
MOM Platform 最大的设计特色是插件化架构。Kubernetes 管理、任务中心、监控中心、AI 助手等核心功能都以「插件」形式提供,前后端联动,支持一键安装/卸载。
不需要 K8s 管理?直接禁用插件即可,不会增加系统负担。需要新功能?按照插件开发规范开发一个,注册即可使用。
🤖 AI 智能运维助手 —— 自然语言驱动运维
这是我认为 MOM 最有竞争力的功能。内置的 AI 助手不是简单的聊天机器人,而是基于Agent + Skills架构的智能运维引擎:
- ReAct 推理循环:AI 自主决策调用合适的 Skill 完成任务
- 36 个内置 Skills:覆盖主机管理、网络设备、K8s 操作、任务执行、监控告警、审计分析、云账号、综合报告 8 大领域
- 多模型支持:OpenAI / DeepSeek / 通义千问 / 豆包 / Google Gemini / Ollama 本地模型
- 高风险操作两步确认:扩缩容、远程命令执行等操作必须用户确认后才执行
- 自定义 Skill 扩展:上传 SKILL.md 规范的 zip 包即可扩展 AI 能力
实际使用效果:
用户:帮我列出所有离线的 Linux 主机 AI :[调用 host.list] 找到 3 台离线主机,分别是... 用户:把生产环境的 nginx Deployment 扩容到 5 个副本 AI :⚠️ 这是高风险操作。即将把 Deployment/nginx 的副本数调整为 5,确认执行吗? 用户:确认 AI :✅ 已成功将 nginx 的副本数调整为 5 用户:帮我生成本周的基础设施运营周报 AI :[调用 analysis.infra_report] 正在生成报告... 📊 本周概况:在管主机 128 台,K8s 集群 3 个,告警 12 次...演示视频1
MOM Platform
演示视频2
MOM Platform (2)
聊天渠道目前支持飞书对接,使用长连接模式
☸️ 多集群 Kubernetes 管理
统一管理多个 K8s 集群,功能覆盖完整的资源生命周期:
| 功能 | 支持的资源类型 |
|---|---|
| 工作负载 | Deployment、StatefulSet、DaemonSet、Job、CronJob |
| 网络与服务 | Service、Ingress、NetworkPolicy |
| 配置与存储 | ConfigMap、Secret、PV/PVC |
| 集群管理 | 节点列表、资源监控、污点/标签、Cordon/Drain |
| 高级功能 | CRD 管理、Helm Release、Web Terminal、集群巡检 |
还支持Web Terminal终端连接,直接在浏览器里kubectl exec进容器,支持会话录制与回放。
🖥️ SSH / RDP 远程连接
- SSH 终端:密码 + 密钥认证,支持拖拽上传密钥文件
- Windows RDP:基于 Apache Guacamole,浏览器直连 Windows 远程桌面
- 文件管理:RDP 文件上传/下载,自动清理临时文件
- 虚拟键盘:美式键盘布局,解决特殊字符输入问题
- 全程录制:SSH 和 RDP 会话全程录制,支持审计回放
☁️ 多云账号管理
支持7 大主流云厂商一键接入:
| 云厂商 | 功能 |
|---|---|
| 阿里云 | 云主机实例查询、一键导入资产 |
| 腾讯云 | 云主机实例查询、一键导入资产 |
| 华为云 | 云主机实例查询、一键导入资产 |
| AWS | 云主机实例查询、一键导入资产 |
| 京东云 | 云主机实例查询、一键导入资产 |
| 百度云 | 云主机实例查询、一键导入资产 |
| 金山云 | 云主机实例查询、一键导入资产 |
把分散在各云控制台的主机统一导入平台管理,再也不用切换多个控制台了。
🔐 精细化权限控制
- 双重 RBAC:平台级权限 + Kubernetes 级权限
- 资产级隔离:查看、编辑、删除、SSH、RDP、文件管理 6 种权限粒度
- 友好提示:无权限时提示「无访问权限」而不是「连接错误」
📋 操作审计
运维操作全程可追溯:
- 操作日志完整记录
- SSH / RDP 会话录制与回放
- 数据变更追溯
- AI 操作审计:AI 助手的每次 Skill 调用都记录到日志,按模块分类筛选
二、AI 助手内置技能一览
MOM 的 AI 助手内置了36 个 Skills,按 8 大分类组织:
| 分类 | Skills | 能力描述 |
|---|---|---|
| 🖥️ 主机管理 | host.listhost.detailhost.analyzehost.exec_commandhost.file_manage等 | 主机查询、分析、远程命令、文件管理 |
| 🌐 网络设备 | device.listdevice.detaildevice.exec_command等 | 网络设备管理、远程命令 |
| ☸️ Kubernetes | k8s.kubectlk8s.scalek8s.restartk8s.diagnosek8s.helm_manage等 | 全资源操作、扩缩容、诊断、Helm |
| 📋 任务中心 | task.executetask.ansibletask.history | Ad-hoc 任务、Ansible Playbook |
| 📡 监控告警 | monitor.domain_statusmonitor.alert_summary等 | 域名监控、告警分析 |
| 🔍 审计分析 | audit.operation_summaryaudit.login_analysis等 | 操作统计、登录分析 |
| ☁️ 云账号 | cloud.list_accountscloud.import_hosts等 | 云账号管理、主机导入 |
| 📊 综合分析 | analysis.infra_reportanalysis.security_auditanalysis.capacity_plan | 运营周报、安全审计、容量规划 |
而且支持自定义 Skill 上传,编写一个SKILL.md文件打包成 zip 即可扩展 AI 能力,无需修改源码。
三、技术栈
| 层级 | 技术选型 |
|---|---|
| 后端 | Go 1.21+ / Gin / GORM / client-go / WebSocket |
| 前端 | Vue 3.5+ / TypeScript / Element Plus / Vite / xterm.js |
| 数据库 | MySQL 8.0+(兼容 TiDB 分布式数据库) |
| 缓存 | Redis 6.0+ |
| 远程桌面 | Apache Guacamole 1.5+ |
| AI | OpenAI Compatible API / 多模型适配器 |
系统架构图:
┌──────────────────────────────────────┐ │ 浏览器客户端 │ │ Vue 3 + Element Plus + TypeScript │ └──────────────┬───────────────────────┘ │ HTTP / WebSocket ┌──────────────▼───────────────────────┐ │ Gin HTTP Server │ │ JWT Auth │ RBAC │ Audit Middleware │ ├────────┬─────┴─────┬─────────┬────────┤ │ Core │ Plugins │ AI │ Asset │ │ Module │ Manager │ Agent │ Mgr │ ├────────┼───────────┼─────────┼────────┤ │ User │ K8s │ Model │ Host │ │ Role │ Task │ Adapter │ Cred │ │ Menu │ Monitor │ Skills │ Cloud │ ├────────┴───────────┴─────────┴────────┤ │ GORM / Data Layer │ └────────┬────────────────────┬─────────┘ │ │ ┌────────▼───────┐ ┌────────▼────────┐ │ MySQL / TiDB │ │ K8s API Server │ └────────────────┘ └─────────────────┘四、功能列表总览
基础功能
| 功能模块 | 描述 |
|---|---|
| 用户管理 | 用户 CRUD、LDAP 集成、密码重置、状态管理 |
| 角色管理 | 角色定义、菜单权限分配 |
| 部门管理 | 组织架构管理、部门层级 |
| 岗位管理 | 岗位定义、用户绑定 |
| 菜单管理 | 动态菜单、支持插件菜单编辑 |
| 凭据管理 | SSH 密码/密钥统一管理 |
| 资产管理 | 主机分组、标签、批量导入导出 |
| 操作审计 | 操作日志、登录日志、AI 操作审计 |
插件功能
| 插件 | 核心能力 |
|---|---|
| Kubernetes 管理 | 多集群、工作负载、网络、存储、CRD、Helm、Web Terminal、集群巡检 |
| 任务中心 | 脚本执行、模板管理、文件分发、执行历史 |
| 监控中心 | 域名监控(HTTP/SSL)、告警管理、多渠道通知 |
| AI 智能助手 | 多模型、36 Skills、自定义扩展、工具可视化、操作审计 |
| RDP 远程桌面 | Windows 远程连接、文件管理、虚拟键盘、会话录制 |
五、与同类项目对比
| 特性 | MOM Platform | JumpServer | 蓝鲸 | KubeSphere |
|---|---|---|---|---|
| 插件化架构 | ✅ | ❌ | ✅ | ✅ |
| AI 运维助手 | ✅ 36 Skills | ❌ | ❌ | ❌ |
| 多集群 K8s | ✅ | ❌ | ✅ | ✅ |
| SSH 终端 | ✅ | ✅ | ✅ | ✅ |
| RDP 远程桌面 | ✅ | ✅ | ❌ | ❌ |
| 多云账号 | ✅ 7 家 | ❌ | ✅ | ❌ |
| 会话录制回放 | ✅ | ✅ | ❌ | ❌ |
| 集群巡检 | ✅ | ❌ | ❌ | ❌ |
| LDAP 集成 | ✅ | ✅ | ✅ | ✅ |
| 开源协议 | MIT | GPL v3 | 自有 | Apache 2.0 |
| 技术栈 | Go + Vue 3 | Python + Vue | Python + Vue | Go + Vue |
| 部署难度 | ⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
七、未来规划
| 功能 | 描述 |
|---|---|
| 数据库远程终端 | MySQL、Oracle、PostgreSQL 远程终端,AI 助手支持 |
| CI/CD 集成 | 对接 GitLab、Jenkins CI,ArgoCD 持续部署 |
总结
MOM Platform 是一个功能完整、设计现代、开箱即用的运维管理平台。它最大的特色是:
- 插件化架构:按需加载,不臃肿
- AI 智能助手:36 个内置技能,自然语言驱动运维
- 全栈覆盖:从主机资产到 K8s 集群,从 SSH 终端到 RDP 桌面
- 安全可控:双重 RBAC + 操作审计 + AI 高风险确认
- 开源友好:MIT 协议,可自由使用和二次开发
如果你正在寻找一个现代化的运维管理平台,不妨试试 MOM Platform。
本项目 基于原项目 https://github.com/ydcloud-dy/opshub 进行二次开发
docker-compose.yml 快速启动,开源地址 https://github.com/tengdagg/MOM_Platform.git
先创建数据存放目录
mkdir -p /var/lib/mysql-data
mkdir -p /var/lib/redis-data
然后 docker-compose up -d
version:'3.8'services:# MySQL 数据库mysql: image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/mysql:8.0.44 container_name: mom-mysql restart: unless-stopped environment: MYSQL_ROOT_PASSWORD:${MYSQL_ROOT_PASSWORD:-123456}MYSQL_DATABASE:${MYSQL_DATABASE:-mom}TZ: Asia/Shanghai ports: -"${MYSQL_PORT:-3306}:3306"volumes: - mysql-data:/var/lib/mysql command: --default-authentication-plugin=mysql_native_password --character-set-server=utf8mb4 --collation-server=utf8mb4_unicode_ci healthcheck: test:["CMD-SHELL","mysqladmin ping -h 127.0.0.1 -u root -p${MYSQL_ROOT_PASSWORD:-123456}|| exit 1"]interval: 3s timeout: 3s retries:10networks: - mom-network# Redis 缓存redis: image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/redis:7-alpine container_name: mom-redis restart: unless-stopped ports: -"${REDIS_PORT:-6379}:6379"volumes: - redis-data:/data command: redis-server--appendonlyyesnetworks: - mom-network# 后端服务backend:#build:# context: .# dockerfile: Dockerfileimage: registry.cn-hangzhou.aliyuncs.com/registry_dat/mom_platform:latest container_name: mom-backend restart: unless-stopped ports: -"${BACKEND_PORT:-9876}:9876"environment: MOM_SERVER_MODE:${MOM_SERVER_MODE:-release}MOM_SERVER_HTTP_PORT:9876MOM_SERVER_JWT_SECRET:${MOM_SERVER_JWT_SECRET:-your-secret-key-change-in-production}MOM_DATABASE_HOST: mysql MOM_DATABASE_PORT:3306MOM_DATABASE_DATABASE:${MYSQL_DATABASE:-mom}MOM_DATABASE_USERNAME:${MYSQL_USERNAME:-root}MOM_DATABASE_PASSWORD:${MYSQL_ROOT_PASSWORD:-123456}MOM_REDIS_HOST: redis MOM_REDIS_PORT:6379MOM_REDIS_PASSWORD:""MOM_GUACD_HOST: guacd MOM_GUACD_PORT:4822depends_on: mysql: condition: service_healthy redis: condition: service_started guacd: condition: service_started volumes: - ./logs:/app/logs networks: - mom-network# Guacamole 代理守护进程 (用于 Windows RDP 远程连接)guacd: image: registry.cn-hangzhou.aliyuncs.com/registry_dat/guacd:latest container_name: mom-guacd restart: unless-stopped ports: -"${GUACD_PORT:-4822}:4822"tmpfs: - /tmp/guacd-drive:size=512M networks: - mom-network# 前端服务(nginx 静态文件服务)frontend: image: registry.cn-hangzhou.aliyuncs.com/registry_dat/mom_platform_front:latest container_name: mom-frontend restart: unless-stopped ports: -"${FRONTEND_PORT:-8080}:80"depends_on: - backend networks: - mom-network volumes: mysql-data: driver:localdriver_opts: type: none device: /var/lib/mysql-data# 修改为你想要的路径o:bindredis-data: driver:localdriver_opts: type: none device: /var/lib/redis-data# 修改为你想要的路径o:bindnetworks: mom-network: driver: bridge登录用户名 admin 密码 123456
作者简介:一个热爱运维自动化的工程师,专注于云原生、DevOps 和 AIOps 领域的开源实践。
