当前位置: 首页 > news >正文

springboot服务监控脚本1.0

背景:

系统刚上线,需要监控各网格服务的运行状态,仅靠人工监控,费事费力,费成本。但还要满足系统需求,还需要满足领导的要求。于是乎,开干~

实现思路:

编写脚本,加入定时任务,配置服务异常邮件告警,最好结合SpringBoot 多应用管理脚本实现,这篇文章使用。当然也可自行改造。

监控内容:

1. 检查期望的服务列表是否运行。
2. 显示运行服务的详细状态(服务名、PID、运行状态、运行时长、CPU使用率、物理内存、线程数 )。
3. 对停止的服务进行告警。
4. 支持邮件和企业微信两种告警方式(脚本里配置)。

开干上脚本:

都是热乎的,刚用,小伙伴们估计看到了,有2.0版本,晚会上:

java_health_checker1.0.sh

#!/bin/bash # ============================================================================== # Java服务状态监控脚本 (健康检查与告警完整版) # 功能: # 1. 检查期望的服务列表是否运行。 # 2. 显示运行服务的详细状态。 # 3. 对停止的服务进行告警。 # 4. 支持邮件和企业微信两种告警方式。 # ============================================================================== # 颜色定义 RED='\033[0;31m' GREEN='\033[0;32m' YELLOW='\033[1;33m' BLUE='\033[0;34m' NC='\033[0m' # No Color # ============================================================================== # 配置区域:请在这里修改配置 # ============================================================================== # --- 期望监控的服务列表 --- # 格式: "服务名:端口号" EXPECTED_SERVICES=( "model:8286" "esb:8285" *****服务自定义(根据实际情况修改) ) # --- 邮件告警设置 (方案一) --- EMAIL_ENABLED=false # true:启用, false:禁用 EMAIL_TO="*****@dtestcom" # 接收告警的邮箱 EMAIL_SUBJECT="[******] Java服务健康检查报告" # 邮件主题 # --- 企业微信告警设置 (方案二) --- WECHAT_ENABLED=false # true:启用, false:禁用 # 请替换为您自己的企业微信机器人Webhook地址 WECHAT_WEBHOOK_URL="https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=YOUR_KEY_HERE" # ============================================================================== # 打印标题 echo -e "${BLUE}============================================${NC}" echo -e "${BLUE} ****** $(hostname) Java服务健康巡检报告${NC}" echo -e "${BLUE} $(date '+%Y-%m-%d %H:%M:%S')${NC}" echo -e "${BLUE} 当前IP:$(hostname -I | awk '{print $1}')${NC}" echo -e "${BLUE}============================================${NC}" # 创建一个关联数组,用于存储正在运行的服务信息 declare -A running_services # --- 1. 扫描并收集所有正在运行的Java服务信息 --- echo -e "${GREEN}🔍 正在扫描当前运行的Java服务...${NC}" echo "" # 使用pgrep获取所有Java进程的PID java_pids=$(pgrep -f java) if [ -n "$java_pids" ]; then for pid in $java_pids; do # 获取完整命令行 full_cmd=$(ps -p $pid -o cmd=) if [[ "$full_cmd" != *"java"* ]]; then continue fi # 提取服务名和端口 service_name=$(echo "$full_cmd" | grep -oP 'SW_AGENT_NAME=\K[^ ]+' | head -1) if [ -z "$service_name" ]; then service_name=$(echo "$full_cmd" | grep -oP '\-jar\s+\K[^\.]+' | head -1) fi #port=$(echo "$full_cmd" | grep -oP 'server\.port=\K\d+' | head -1) port=$(echo "$full_cmd" | grep -oP 'D?server\.port=\K\d+' | head -1) # 如果服务名和端口都有效,存入数组 if [ -n "$service_name" ] && [ -n "$port" ]; then running_services["${service_name}:${port}"]="$pid" fi done fi # --- 2. 检查期望的服务状态 --- echo -e "${BLUE}📋 开始检查期望的服务状态...${NC}" echo "" down_services_count=0 down_services_list="" # 遍历期望的服务列表 for expected_service in "${EXPECTED_SERVICES[@]}"; do if [[ -n "${running_services[$expected_service]}" ]]; then # 服务正在运行 pid=${running_services[$expected_service]} service_name=${expected_service%:*} # 获取运行时信息 etime=$(ps -p $pid -o etime= | tr -d ' ') cpu_usage=$(ps -p $pid -o %cpu= | tr -d ' ') mem_rss=$(ps -p $pid -o rss= | tr -d ' ') threads=$(ps -p $pid -o nlwp= | tr -d ' ') mem_rss_mb=$(echo "$mem_rss" | awk '{printf "%.0f", $1/1024}') echo -e "${GREEN}✅ ${service_name} (PID: ${pid}) - 运行正常${NC}" printf " %-10s: %s\n" "运行时长" "$etime" printf " %-10s: %s%%\n" "CPU使用率" "$cpu_usage" printf " %-10s: %s MB\n" "物理内存" "$mem_rss_mb" printf " %-10s: %s\n" "线程数" "$threads" echo "" else # 服务停止或异常 service_name=${expected_service%:*} echo -e "${RED}❌ ${service_name} - 服务停止或异常!${NC}" ((down_services_count++)) down_services_list="${down_services_list} ${service_name}" fi done # --- 3. 最终报告与告警发送 --- echo -e "${BLUE}============================================${NC}" if [ "$down_services_count" -eq 0 ]; then echo -e "${GREEN}🎉 所有期望的服务都在正常运行!${NC}" else echo -e "${RED}⚠️ 发现 ${down_services_count} 个服务存在问题,请立即检查!${NC}" # --- 发送邮件告警 --- if [ "$EMAIL_ENABLED" = true ]; then echo -e "${YELLOW}📧 正在发送告警邮件到 $EMAIL_TO ...${NC}" email_body=$(cat <<EOF 服务器 $(hostname) 上的Java服务健康检查发现异常! 时间: $(date '+%Y-%m-%d %H:%M:%S') 异常服务数量: $down_services_count 异常服务列表: $down_services_list 请登录服务器检查详细情况。\n EOF ) echo "$email_body" | mailx -s "$EMAIL_SUBJECT - [ALERT]" "$EMAIL_TO" if [ $? -eq 0 ]; then echo -e "${GREEN}✅ 告警邮件发送成功!${NC}" else echo -e "${RED}❌ 告警邮件发送失败!请检查邮件配置。${NC}" fi fi # --- 发送企业微信告警 --- if [ "$WECHAT_ENABLED" = true ]; then echo -e "${YELLOW}📱 正在发送企业微信告警...${NC}" # 构建JSON消息体 message=$(cat <<EOF { "msgtype": "markdown", "markdown": { "content": "<font color='warning'>【$(hostname)服务告警】</font>\n\n> 服务器: <code>prd1</code>\n> 时间: <code>$(date '+%Y-%m-%d %H:%M:%S')</code>\n> 异常服务数: <code>$down_services_count</code>\n> 异常列表: <code>${down_services_list//\\n/ }</code>\n\n请立即登录服务器检查!" } } EOF ) # 发送HTTP请求 curl -s -X POST "$WECHAT_WEBHOOK_URL" \ -H "Content-Type: application/json" \ -d "$message" > /dev/null 2>&1 if [ $? -eq 0 ]; then echo -e "${GREEN}✅ 企业微信告警发送成功!${NC}" else echo -e "${RED}❌ 企业微信告警发送失败!请检查Webhook URL和网络。${NC}" fi fi fi echo -e "${BLUE}============================================${NC}" # 如果有服务停止,脚本的退出码为1,便于告警系统识别 if [ "$down_services_count" -gt 0 ]; then exit 1 fi

效果展示:

其他功能:

1、可配置邮件通知。

2、使用crontab定时巡检。

因为时间有限,这些之前文章也提到过,可自行配置。

http://www.jsqmd.com/news/100024/

相关文章:

  • 基于STM32单片机图像识别计数器颜色识别数量统计蓝牙无线APP/WiFi无线APP/摄像头视频监控/云平台设计S107
  • 低配置电脑也能玩的游戏有哪些?多款佳作推荐 - 品牌排行榜
  • Wan2.2-T2V-A14B部署指南:快速接入高保真视频生成
  • window 下安装和配置 jdk1.8环境
  • blender/ue为朋友生日礼物记录(可能是大一上结算。?)
  • 仿照若依框架进行数据权限控制
  • 视频推流平台EasyDSS无人机推流直播技术在野外监测中的智能应用
  • 2025球轴承实力制造商TOP5权威推荐:甄选高品质厂家,助 - 工业推荐榜
  • LobeChat能否持续学习?在线更新能力探讨
  • LobeChat能否支持WebRTC?实时音视频通话功能展望
  • 【赵渝强老师】达梦数据库的逻辑存储结构
  • 2025高空安装公司TOP5权威推荐:高空安装哪家技术好? - myqiye
  • 《12个月服务期!黑龙江炉渣外运处置项目公开招标》
  • 2025年南京地区适合婚礼宴会的餐厅推荐,浪漫婚礼餐厅解析 - mypinpai
  • 详细介绍:Flink Oracle CDC Connector 实战指南
  • 一篇搞定DevBox开源项目在开源鸿蒙PC安装运行
  • synopsys axi vip疑问
  • 2025铜包钢服务商实力推荐,看看哪家质量可靠? - 工业推荐榜
  • 2025铜包钢服务商实力推荐,看看哪家质量可靠? - 工业推荐榜
  • Kotaemon集成GraphRAG构建智能文档问答系统
  • 出境游旅行社哪家服务好?从服务体验看选择方向 - 品牌排行榜
  • 【赵渝强老师】在Docker中运行达梦数据库
  • 2025法兰轴承生产厂TOP5权威推荐:技术/口碑/案例三维 - mypinpai
  • Flux.1-dev高清修复ControlNets上线
  • LobeChat能否集成GitHub?代码协作更高效
  • python实现密码暴力破解
  • 2025高空特种工程服务商TOP5权威推荐:盈尚环境工程(杭 - myqiye
  • Go Defer语句详解
  • npm安装常见错误及解决方案汇总(YOLO专用)
  • 2025年国产电脑操作系统推荐:银河麒麟为何成为党政机关首选?