当前位置: 首页 > news >正文

告别原始命令操作运维,使用自然语言驱动运维 K8S集群、主机、网络设备相关操作

MOM Platform —— 插件化云原生运维管理平台,让运维更简单

前言

作为运维工程师,你是否遇到过这些痛点:

  • 🤯 资产分散在 Excel、CMDB、各种云控制台,没有统一管理界面
  • 😫 K8s 多集群管理需要频繁切换 kubeconfig,效率低下
  • 🔑 SSH 密钥散落各处,每次登录都要找半天
  • 📊 老板要运营周报,手动从各系统拼凑数据
  • 🤖 想用 AI 辅助运维,自动化运维

如果你也有这些困扰,那MOM Platform可能正是你需要的。

MOM Platform(Multi-platform Operations Manager,多元运维管理平台)是一个开源的插件化运维管理平台,采用 Go + Vue 3 前后端分离架构,支持多集群 K8s 管理、资产管理、多云账号、远程连接、AI 智能运维等功能。


一、核心亮点

🧩 插件化架构 —— 按需加载,灵活扩展

MOM Platform 最大的设计特色是插件化架构。Kubernetes 管理、任务中心、监控中心、AI 助手等核心功能都以「插件」形式提供,前后端联动,支持一键安装/卸载

不需要 K8s 管理?直接禁用插件即可,不会增加系统负担。需要新功能?按照插件开发规范开发一个,注册即可使用。

🤖 AI 智能运维助手 —— 自然语言驱动运维

这是我认为 MOM 最有竞争力的功能。内置的 AI 助手不是简单的聊天机器人,而是基于Agent + Skills架构的智能运维引擎:

  • ReAct 推理循环:AI 自主决策调用合适的 Skill 完成任务
  • 36 个内置 Skills:覆盖主机管理、网络设备、K8s 操作、任务执行、监控告警、审计分析、云账号、综合报告 8 大领域
  • 多模型支持:OpenAI / DeepSeek / 通义千问 / 豆包 / Google Gemini / Ollama 本地模型
  • 高风险操作两步确认:扩缩容、远程命令执行等操作必须用户确认后才执行
  • 自定义 Skill 扩展:上传 SKILL.md 规范的 zip 包即可扩展 AI 能力

实际使用效果:

用户:帮我列出所有离线的 Linux 主机 AI :[调用 host.list] 找到 3 台离线主机,分别是... 用户:把生产环境的 nginx Deployment 扩容到 5 个副本 AI :⚠️ 这是高风险操作。即将把 Deployment/nginx 的副本数调整为 5,确认执行吗? 用户:确认 AI :✅ 已成功将 nginx 的副本数调整为 5 用户:帮我生成本周的基础设施运营周报 AI :[调用 analysis.infra_report] 正在生成报告... 📊 本周概况:在管主机 128 台,K8s 集群 3 个,告警 12 次...

演示视频1

MOM Platform


演示视频2

MOM Platform (2)


聊天渠道目前支持飞书对接,使用长连接模式

☸️ 多集群 Kubernetes 管理

统一管理多个 K8s 集群,功能覆盖完整的资源生命周期:

功能支持的资源类型
工作负载Deployment、StatefulSet、DaemonSet、Job、CronJob
网络与服务Service、Ingress、NetworkPolicy
配置与存储ConfigMap、Secret、PV/PVC
集群管理节点列表、资源监控、污点/标签、Cordon/Drain
高级功能CRD 管理、Helm Release、Web Terminal、集群巡检

还支持Web Terminal终端连接,直接在浏览器里kubectl exec进容器,支持会话录制与回放。


🖥️ SSH / RDP 远程连接

  • SSH 终端:密码 + 密钥认证,支持拖拽上传密钥文件
  • Windows RDP:基于 Apache Guacamole,浏览器直连 Windows 远程桌面
  • 文件管理:RDP 文件上传/下载,自动清理临时文件
  • 虚拟键盘:美式键盘布局,解决特殊字符输入问题
  • 全程录制:SSH 和 RDP 会话全程录制,支持审计回放


☁️ 多云账号管理

支持7 大主流云厂商一键接入:

云厂商功能
阿里云云主机实例查询、一键导入资产
腾讯云云主机实例查询、一键导入资产
华为云云主机实例查询、一键导入资产
AWS云主机实例查询、一键导入资产
京东云云主机实例查询、一键导入资产
百度云云主机实例查询、一键导入资产
金山云云主机实例查询、一键导入资产

把分散在各云控制台的主机统一导入平台管理,再也不用切换多个控制台了。

🔐 精细化权限控制

  • 双重 RBAC:平台级权限 + Kubernetes 级权限
  • 资产级隔离:查看、编辑、删除、SSH、RDP、文件管理 6 种权限粒度
  • 友好提示:无权限时提示「无访问权限」而不是「连接错误」

📋 操作审计

运维操作全程可追溯:

  • 操作日志完整记录
  • SSH / RDP 会话录制与回放
  • 数据变更追溯
  • AI 操作审计:AI 助手的每次 Skill 调用都记录到日志,按模块分类筛选

二、AI 助手内置技能一览

MOM 的 AI 助手内置了36 个 Skills,按 8 大分类组织:

分类Skills能力描述
🖥️ 主机管理host.listhost.detailhost.analyzehost.exec_commandhost.file_manage主机查询、分析、远程命令、文件管理
🌐 网络设备device.listdevice.detaildevice.exec_command网络设备管理、远程命令
☸️ Kubernetesk8s.kubectlk8s.scalek8s.restartk8s.diagnosek8s.helm_manage全资源操作、扩缩容、诊断、Helm
📋 任务中心task.executetask.ansibletask.historyAd-hoc 任务、Ansible Playbook
📡 监控告警monitor.domain_statusmonitor.alert_summary域名监控、告警分析
🔍 审计分析audit.operation_summaryaudit.login_analysis操作统计、登录分析
☁️ 云账号cloud.list_accountscloud.import_hosts云账号管理、主机导入
📊 综合分析analysis.infra_reportanalysis.security_auditanalysis.capacity_plan运营周报、安全审计、容量规划

而且支持自定义 Skill 上传,编写一个SKILL.md文件打包成 zip 即可扩展 AI 能力,无需修改源码。


三、技术栈

层级技术选型
后端Go 1.21+ / Gin / GORM / client-go / WebSocket
前端Vue 3.5+ / TypeScript / Element Plus / Vite / xterm.js
数据库MySQL 8.0+(兼容 TiDB 分布式数据库)
缓存Redis 6.0+
远程桌面Apache Guacamole 1.5+
AIOpenAI Compatible API / 多模型适配器

系统架构图:

┌──────────────────────────────────────┐ │ 浏览器客户端 │ │ Vue 3 + Element Plus + TypeScript │ └──────────────┬───────────────────────┘ │ HTTP / WebSocket ┌──────────────▼───────────────────────┐ │ Gin HTTP Server │ │ JWT Auth │ RBAC │ Audit Middleware │ ├────────┬─────┴─────┬─────────┬────────┤ │ Core │ Plugins │ AI │ Asset │ │ Module │ Manager │ Agent │ Mgr │ ├────────┼───────────┼─────────┼────────┤ │ User │ K8s │ Model │ Host │ │ Role │ Task │ Adapter │ Cred │ │ Menu │ Monitor │ Skills │ Cloud │ ├────────┴───────────┴─────────┴────────┤ │ GORM / Data Layer │ └────────┬────────────────────┬─────────┘ │ │ ┌────────▼───────┐ ┌────────▼────────┐ │ MySQL / TiDB │ │ K8s API Server │ └────────────────┘ └─────────────────┘

四、功能列表总览

基础功能

功能模块描述
用户管理用户 CRUD、LDAP 集成、密码重置、状态管理
角色管理角色定义、菜单权限分配
部门管理组织架构管理、部门层级
岗位管理岗位定义、用户绑定
菜单管理动态菜单、支持插件菜单编辑
凭据管理SSH 密码/密钥统一管理
资产管理主机分组、标签、批量导入导出
操作审计操作日志、登录日志、AI 操作审计

插件功能

插件核心能力
Kubernetes 管理多集群、工作负载、网络、存储、CRD、Helm、Web Terminal、集群巡检
任务中心脚本执行、模板管理、文件分发、执行历史
监控中心域名监控(HTTP/SSL)、告警管理、多渠道通知
AI 智能助手多模型、36 Skills、自定义扩展、工具可视化、操作审计
RDP 远程桌面Windows 远程连接、文件管理、虚拟键盘、会话录制

五、与同类项目对比

特性MOM PlatformJumpServer蓝鲸KubeSphere
插件化架构
AI 运维助手✅ 36 Skills
多集群 K8s
SSH 终端
RDP 远程桌面
多云账号✅ 7 家
会话录制回放
集群巡检
LDAP 集成
开源协议MITGPL v3自有Apache 2.0
技术栈Go + Vue 3Python + VuePython + VueGo + Vue
部署难度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

七、未来规划

功能描述
数据库远程终端MySQL、Oracle、PostgreSQL 远程终端,AI 助手支持
CI/CD 集成对接 GitLab、Jenkins CI,ArgoCD 持续部署

总结

MOM Platform 是一个功能完整、设计现代、开箱即用的运维管理平台。它最大的特色是:

  1. 插件化架构:按需加载,不臃肿
  2. AI 智能助手:36 个内置技能,自然语言驱动运维
  3. 全栈覆盖:从主机资产到 K8s 集群,从 SSH 终端到 RDP 桌面
  4. 安全可控:双重 RBAC + 操作审计 + AI 高风险确认
  5. 开源友好:MIT 协议,可自由使用和二次开发

如果你正在寻找一个现代化的运维管理平台,不妨试试 MOM Platform。
本项目 基于原项目 https://github.com/ydcloud-dy/opshub 进行二次开发
docker-compose.yml 快速启动,开源地址 https://github.com/tengdagg/MOM_Platform.git

先创建数据存放目录

mkdir -p /var/lib/mysql-data
mkdir -p /var/lib/redis-data

然后 docker-compose up -d

version:'3.8'services:# MySQL 数据库mysql: image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/mysql:8.0.44 container_name: mom-mysql restart: unless-stopped environment: MYSQL_ROOT_PASSWORD:${MYSQL_ROOT_PASSWORD:-123456}MYSQL_DATABASE:${MYSQL_DATABASE:-mom}TZ: Asia/Shanghai ports: -"${MYSQL_PORT:-3306}:3306"volumes: - mysql-data:/var/lib/mysql command: --default-authentication-plugin=mysql_native_password --character-set-server=utf8mb4 --collation-server=utf8mb4_unicode_ci healthcheck: test:["CMD-SHELL","mysqladmin ping -h 127.0.0.1 -u root -p${MYSQL_ROOT_PASSWORD:-123456}|| exit 1"]interval: 3s timeout: 3s retries:10networks: - mom-network# Redis 缓存redis: image: swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/redis:7-alpine container_name: mom-redis restart: unless-stopped ports: -"${REDIS_PORT:-6379}:6379"volumes: - redis-data:/data command: redis-server--appendonlyyesnetworks: - mom-network# 后端服务backend:#build:# context: .# dockerfile: Dockerfileimage: registry.cn-hangzhou.aliyuncs.com/registry_dat/mom_platform:latest container_name: mom-backend restart: unless-stopped ports: -"${BACKEND_PORT:-9876}:9876"environment: MOM_SERVER_MODE:${MOM_SERVER_MODE:-release}MOM_SERVER_HTTP_PORT:9876MOM_SERVER_JWT_SECRET:${MOM_SERVER_JWT_SECRET:-your-secret-key-change-in-production}MOM_DATABASE_HOST: mysql MOM_DATABASE_PORT:3306MOM_DATABASE_DATABASE:${MYSQL_DATABASE:-mom}MOM_DATABASE_USERNAME:${MYSQL_USERNAME:-root}MOM_DATABASE_PASSWORD:${MYSQL_ROOT_PASSWORD:-123456}MOM_REDIS_HOST: redis MOM_REDIS_PORT:6379MOM_REDIS_PASSWORD:""MOM_GUACD_HOST: guacd MOM_GUACD_PORT:4822depends_on: mysql: condition: service_healthy redis: condition: service_started guacd: condition: service_started volumes: - ./logs:/app/logs networks: - mom-network# Guacamole 代理守护进程 (用于 Windows RDP 远程连接)guacd: image: registry.cn-hangzhou.aliyuncs.com/registry_dat/guacd:latest container_name: mom-guacd restart: unless-stopped ports: -"${GUACD_PORT:-4822}:4822"tmpfs: - /tmp/guacd-drive:size=512M networks: - mom-network# 前端服务(nginx 静态文件服务)frontend: image: registry.cn-hangzhou.aliyuncs.com/registry_dat/mom_platform_front:latest container_name: mom-frontend restart: unless-stopped ports: -"${FRONTEND_PORT:-8080}:80"depends_on: - backend networks: - mom-network volumes: mysql-data: driver:localdriver_opts: type: none device: /var/lib/mysql-data# 修改为你想要的路径o:bindredis-data: driver:localdriver_opts: type: none device: /var/lib/redis-data# 修改为你想要的路径o:bindnetworks: mom-network: driver: bridge

登录用户名 admin 密码 123456

作者简介:一个热爱运维自动化的工程师,专注于云原生、DevOps 和 AIOps 领域的开源实践。

http://www.jsqmd.com/news/471788/

相关文章:

  • Docker镜像远程(离线)迁移教程
  • 震动传感器(STM32)
  • (一)基础:线性模型
  • Python爬虫实战:逆向解包 Unsplash 官方编辑精选合集!
  • 上海/北京高端腕表维修指南:江诗丹顿/欧米茄常见故障与科学养护解析 - 时光修表匠
  • React Hooks 设计思想与自定义 Hook 开发实践
  • V8引擎深度解密:Isolate隔离机制如何保障多环境安全执行
  • CSP与Nonce集成实战:Next.js、Nuxt、Remix官方方案详解
  • C语言完美演绎3-12
  • 2026年Shulex VOC优惠折扣码最新更新 | 功能详细拆解 - 麦麦唛
  • OpenClaw 第二篇:核心架构拆解——从一句指令到自动执行的全流程
  • API实战:CUDA实现数组求和—— 综合使用内存API、内核API、事件API,对比串行/并行性能
  • React Context API:状态管理与性能优化的探索
  • 2026连云港装修公司综合评分推荐:一份基于20+数据维度的权威报告 - GEO排行榜
  • 磁盘分区与文件系统
  • ArrayList动态扩容机制
  • 化繁为简:Access 与 SQL 创新指南(第一篇)
  • Vue 3 Composition API 的逻辑复用模式探索
  • 中国国家级地面气象站基本气象要素日值数据集(V3.0)
  • Netty源码分析---waken方法详解
  • Python爬虫实战:鸣枪起跑!深度抓取全国马拉松赛事报名情报!
  • Vue 响应式原理与依赖追踪机制解析
  • 请求报错:cannot deserialize from Object value (no delegate- or property-based Creator)
  • 为什么你“什么都知道”,却依然炒不好股?
  • 1377605-22-5,Biotinylated isoxazole 在相分离凝聚物药物筛选中的前景
  • JavaScript 异步编程:Promise 与 async/await 的探索
  • TensorRT C++部署流程
  • Linux-C socket网络通信 03.25
  • 一键解锁 N 种快乐, 蘑兔ai音乐也太会了
  • PDF.js实战:教你给企业官网嵌入可定制化的PDF阅读器(附源码)