当前位置: 首页 > news >正文

部署安装CLup(6.0版本-超详细)

一、概述

很多人对CLup应该不陌生了吧,它是一套私有云平台,是一款聚焦虚拟化IaaS层与数据库生态PaaS层的融合型平台。针对数据库场景,将复杂的IaaS层操作(如虚拟机管理、存储分配)与数据库高可用(自动故障切换)、实时监控、定时备份等能力整合封装,提供简单易用的特性,具备开箱即用、自动化及可视化功能,可轻松创建和管理数万个虚拟机和数千套数据库集群。

CLup平台创建虚拟机和LXC容器,其特点如下:

  • CLup可以秒级创建虚拟机和LXC容器。
  • 虚拟机的镜像文件可以放在本地存储上,也可以放在ceph存储上。
  • 虚拟机可以支持单独的数据盘,以满足高性能IO的要求。
  • 虚拟机支持GPU卡的透明穿透,方便一块GPU卡给多人使用。

使用CLup可以轻松创建和管理成千上万套虚拟机和LXC容器,大大的提高了系统管理的效率。

CLup也是一套数据库的PaaS私有云平台,在此平台上可以创建和管理各种常用数据库如Oracle、MySQL、PostgreSQL、MongoDB、Redis等,以及信创数据库如达梦、金仓、PolarDB、HighgoDB、GaussDB、VastBase、崖山等数据库。

CLup平台提供一下的数据库管理功能:

  • 可以把用户现有的数据库纳管到此平台中来管理。
  • 可以快速创建出一套可以在生产系统上使用的数据库系统,这套数据库有高可用、监控告警、备份等基本功能,
  • 如何快速搭建现有数据库的备库,如何快速修改主备库之间的级连关系。
  • 如何通过界面修改数据库的配置。
  • 实现数据库的容灾,当整个机房的网络断了,如何快速恢复业务。

另CLup还提供中启乘数数据库一体机CData的管理功能,即CData的管理功能也是由CLup来完成的。

使用CLup可以轻松创建和管理几十套至上百套高可用的数据库集群。当发生故障切换后,有详细的故障切换日志,方便故障原因定位。另还可以手工一键切换,满足运维中日常停机的需要。CLup还提供了数据库的一些基本监控和TOP SQL的监控以及容灾管理及一键加备库,最大限度的简化DBA的工作。信息来源:https://www.csudata.com/clup/manual/6.x/10415

二、部署安装CLup详解

1、安装基础

1.1 安装包

我们是需要安装两个包,clup-serverX.Y.Z.x86_64.bin和clup-agentX.Y.Z.x86_64.bin,这里的XYZ代表的是版本号

1.2 部署方式

我部署CLup时,需要一台独立服务器安装clup-server,它提供WEB管理界面并负责高可用切换。这台服务器必须能访问所有数据库节点。每台数据库服务器上还要安装clup-agent,主程序就是通过这些agent来控制各数据库的启停和切换操作的。

2、安装要求

2.1 硬件平台要求

在官网有写硬件的要求,clup-server模块需要安装到一台独立的机器上,对此机器的配置要求不是很高,需求如下:

  • X86或ARM64的服务器
  • 对cpu基本没有要求
  • 4G内存以上
  • 硬盘20G以上,如果使用TopSQL的功能,建议200G以上的磁盘空间

2.2 软件依赖

2.2.1 基础依赖

clup-server模块需要运行在操作系统用户clup下,而clup-agent模型需要运行在操作系统的root用户下。

clup-server需要使用jdbc驱动来连接部分数据库如Oracle、达梦、崖山等等,所以安装clup-server的机器需要安装jdk11,通常我们安装openjdk。先检查当前的java版本

java -version

如果版本低于11的话,则需要安装

yum -y install java-11-openjdk java-11-openjdk-devel

把默认java换成11的版本,下面的命令会让你选择java的版本,输入openjdk-11对应的序号,然后回车即可。

update-alternatives --config java

再次检查java的版本

java --version

clup-agent机器上需要安装psmisc.x86_64包,clup-agent需要使用psmisc.x86_64包中的fuser命令。

如果在CentOS或Redhat等操作系统下,安装命令如下:

yum install -y psmisc
2.2.2 虚拟机管理支持

如果需要使用到虚拟机的功能,则需要安装一些依赖:

RHEL 7.X操作系统

yum install -y kvm libvirt python-virtinst qemu-kvm virt-viewer tunctl bridge-utils avahi dmidecode qemu-kvm-tools virt-manager qemu-img virt-install net-tools libguestfs-tools openssl-devel readline-devel

RHEL 8.X操作系统

yum install -y libvirt qemu-kvm virt-viewer bridge-utils avahi dmidecode virt-manager qemu-img virt-install net-tools libguestfs-tools openssl-devel readline-devel

RHEL 9.X操作系统

yum install -y libvirt qemu-kvm virt-viewer avahi dmidecode virt-manager qemu-img virt-install net-tools libguestfs-tools openssl-devel readline-devel

银河麒麟V10操作系统

yum install -y libvirt qemu-kvm virt-viewer bridge-utils avahi dmidecode virt-manager qemu-img virt-install net-tools libguestfs-tools openssl-devel readline-devel

Debian操作系统

apt install net-tools strace sysstat apt install gdb gcc g++ make flex bison gdb apt install qemu-kvm libvirt-clients libvirt-daemon-system bridge-utils virtinst libvirt-daemon

openEuler操作系统

yum install -y libvirt qemu-kvm virt-viewer bridge-utils avahi dmidecode virt-manager qemu-img virt-install net-tools libguestfs-tools openssl-devel readline-devel

以上是各个操作系统安装依赖的命令,按照自己的操纵系统进行按照

启动libvirt服务并设置开机自启

systemctl start libvirtd systemctl enable libvirtd
2.2.3 LXC容器管理支持

如果需要使用LXC容器管理的功能,请提前安装LXC服务和相关依赖,不同的操作系统所需依赖或有不同,下面给出EL9.x的示例作为参考:

dnf install -y lxc lxc-libs lxc-templates

2.3 数据库版本支持

当前已支持的数据库版本,持续更新中。

序号数据库名称支持的版本
1PostgreSQL9.5.x及以上版本
2Oracle11g,12c,19c,21c
3MySQL5.6.x,5.7.x,8.0.x
4达梦数据库8.x
5崖山数据库23.4.x
6瀚高数据库4.5.x,9.x
7GaussDB6.0.x
8PolarDBFor PG 11.x,For PG 15.x
9VastbaseG100
10MongoDB8.0
11StarRocks3.x
12Apache Doris3.x

3、安装clup-server

3.1 使用安装包进行安装

先创建操作系统用户clup

groupadd -g 1910 clup useradd -g clup -u 1910 -s /bin/bash -m clup # 部分Linux发行版适用以下命令 addgroup -g 1910 clup adduser -u 1910 -G clup -s /bin/bash -D clup

把安装包拷贝到操作系统用户clup的任意一个目录下,在操作系统用户clup下执行安装:

bash clup6.0.2.x86_64.bin

这个安装包中实际上是包含一tar压缩包文件,可以用这个的命令把此安装文件中的压缩包解压出来:bash clup6.0.2.x86_64.bin -z

把压缩包从安装包中解压出来的这个功能,通常是用不到的,主要为一些特殊情况下使用。

此安装包安装后会产生以下目录:

  • /home/clup/clup-server
  • /home/clup/clup-serverX.Y.Z
  • /home/clup/csumdb

其中/home/clup/clup-server 为一个链接文件,其指向“/home/clup/clupX.Y.Z”目录。其中此安装程序为方便运行命令,已经把“/home/clup/clup-server/bin”目录放到了PATH环境变量中了。

3.2 clup-server的配置

clup-server的配置文件为/home/clup/clup-server/conf/clup.conf,内容如下:

#格式为 key = value # ++++++++++++++++++++++++++++++++ 网络 ++++++++++++++++++++++++++++++++ # 网络地址(即IP地址与掩码做and位运算后的值),本cluster软件将运行在此网络中,如果主机有多个IP地址,则使用这个网络内的IP地址做为通信的IP #network=192.168.56.0 network=10.197.160.0 # 设置用于检查是否是自己变成了孤岛的检查IP,可以为逗号分隔的多个ip,如果这些IP能ping通,说明不是自己不是孤岛,注意最多设置三个IP,多余的被忽略 #probe_island_ip=192.168.56.1,192.168.0.1 probe_island_ip=10.197.160.1 # ++++++++++++++++++++++++++++++++ 容灾三节点CLup配置 ++++++++++++++++++++++++++++++++ # 如果在3台机器上安装CLup做集群,则需要做下面的设置 # clup_host_list = 192.168.56.50,192.168.56.51,192.168.56.52 # ++++++++++++++++++++++++++++++++ RPC连接 ++++++++++++++++++++++++++++++++ #agent与服务器之间通信的密码 internal_rpc_pass = clup_pass_pwd # 如果是集群模式,要求所有的CLup的server_rpc_port都相等 server_rpc_port = 4242 agent_rpc_port = 4243 # websocket的端口 server_ws_port = 4244 agent_ws_port = 4245 agent_ws_token = cdbmgr # ++++++++++++++++++++++++++++++++ WEB页面 ++++++++++++++++++++++++++++++++ # 当把http_auth设置为0时,用admin用户登录,输入任何密码都可以登录,当忘记密码时的就可以使用解决方法 http_auth = 1 # WEB界面无操作时的过期时间 # session_expired_secs = 600 # 前端管理界面web监听端口 #http_port = 8080 http_port = 8090 # 如果处于安全考虑,禁止使用webterm,可以把这个参数设置为1 disable_webterm = 0 # ++++++++++++++++++++++++++++++++ CLup数据库连接 ++++++++++++++++++++++++++++++++ # 数据库连接配置 db_host = 127.0.0.1 db_port = 3500 db_user = clupapp db_pass = clupMgr232 db_name = clup # 当配置了强制reset机器的命令时,执行完此命令之后,是否检查命令的返回值,如果设置为1,则不管命令执行成功还是失败,都认为成功继续进行HA切换。 # 如果设置为0,则如果reset命令执行失败,则HA切换失败 ignore_reset_cmd_return_code = 0 # csumdb的路径: csumdb_path=/home/clup/csumdb # psql_cmd的路径: psql_cmd=/home/clup/csumdb/pgsql/bin/psql # ++++++++++++++++++++++++++++++++ 性能采集数据库连接 ++++++++++++++++++++++++++++++++ #collect_db_host = 127.0.0.1 #collect_db_port = 3600 #collect_db_user = clupapp #collect_db_pass = clupMgr232 #collect_db_name = clup
配置文件字段说明
字段名说明
network网络地址,本cluster软件将运行在此网络中
mmn_host_listclup集群的ip地址,逗号分隔,如果不是集群模式,需要注释掉
probe_island_ip设置用于检查是否是自己变成了孤岛的检查IP,可以为逗号分隔的多个ip,如果这些IP通ping通,说明不是自己不是孤岛,注意最多设置三个IP,多余的被忽略
internal_rpc_passagent与服务器之间通信的密码
server_rpc_port服务端rpc端口,如果是集群模式,所有的rpc端口需要相同
agent_rpc_port客户端rpc端口
http_auth前端web界面是否需要登录,1:需要登录,0:跳过登录
http_port前端web界面端口
cstlb_tokencstlb负载均衡的token
db_host数据库ip
db_port数据库端口
db_user数据库用户
db_pass数据库密码
db_name数据库名
server_ws_port服务端websocket端口
agent_ws_port客户端websocket端口
agent_ws_token客户端websocket的token
csumdb_pathcsumdb数据库的主路径
psql_cmd设置psql的路径
session_expired_secs

前端web界面的过期时间,单位秒

配置项说明如下:

  • network=10.197.160.0:主程序模块与Agent程序通信的网络,当机器有多个IP时,区分管理走那个网络。
  • probe_island_ip=192.168.160.253,192.168.160.254: 用于检查是否是自己变成了孤岛的检查IP,可以为逗号分隔的多个IP。注意最多设置三个IP,多余的被忽略
  • internal_rpc_pass = XXXXXX # clup-server和clup-agent程序内部之间通信的密码。
  • server_rpc_port = 4242: clup-server的监听端口,用于内部通信。
  • agent_rpc_port = 4243: clup-agent程序的监听端口,用于内部通信。
  • ignore_reset_cmd_return_code = 1:共享存储的高可用数据库防止脑裂的配置, 当配置了强制reset机器的命令时,执行完此命令之后,是否检查reset命令的返回值,如果设置为1,不管reset命令是否执行成功,都进行HA的切换,如果设置为0,如果reset的命令不成功,则HA切换失败。
  • http_auth = 1: 在生产系统应该设置为1,如果设置为0,则登录前端的web界面不需要密码,当忘记密码的情况下,可以把此参数设置为0,然后重新启动主程序后,这时就可以不需要密码就可以登陆系统了,这时就可以重置密码了。
  • db_user = clupapp: 登录CLup自身数据库的用户。
  • db_pass = CLupMgr232: 登录CLup自身数据库的密码。
  • db_host = 127.0.0.1 CLup自身数据库的IP。
  • db_port = 3500: CLup自身数据的端口。
  • db_name = clup: CLup自身数据库的database名称。
  • server_ws_port = 4244: CLup主程序的websocket的端口。
  • agent_ws_port = 4245: Agent程序端的websocket的端口。
  • agent_ws_token = cdbmgr: websocket的token。
  • psql_cmd=/home/clup/csumdb/pgsql/bin/psql: 请把这个路径改成csumdb实际软件的目录。

3.3 启动clup-server

启动clup-server

clup-server start

如果需要虚拟机、LXC管理功能,还需要启动以下两个服务:

# root下为clup-dhcpd服务开放1000以下端口的访问权限 setcap 'cap_net_bind_service=+ep' /home/clup/clup-server/bin/clup-dhcpd clup-dhcpd start clup-webvnc start

clup-dhcpd是一个DHCP服务器,为虚拟机自动分配IP地址和主机名,而clup-webvnc是给虚拟机提供WEB形式的控制台,如果不使用虚拟机功能,也可以不启动这两个服务。

执行上面的命令之后会自动让这几个服务进程立即进入到后台运行的状态。
我们可以用下面的命令查看运行的状态:

clup-server status clup-dhcpd status clup-webvnc status

当然,我们也可以用下面的命令停止clup-server的运行:

clup-server stop clup-dhcpd stop clup-webvnc stop

3.4 查看日志

如果没有成功启动,可以查看日志文件/home/clup/clup-server/logs/clup-server.log中查看没有启动的原因。

3.5 开机自启动服务

上面的方法中,机器重启后,服务不会自动启动起来,需要把clup-server服务设置为开机自启动:

clup-server auto_start

如果想去掉开机自启动:

clup-server auto_start -s

3.6 CLup的元数据库

在安装clup-server模块时,会自动安装一个元数据库,我们称之为csumdb,其在目录“/home/clup/csumdb”目录下,我们运行psql登陆此数据库(默认密码csuMgr232)后会看到如下用户:

csumdb=> \du List of roles Role name | Attributes | Member of -----------+------------------------------------------------------------+----------- csuapp | | {} csumdb | Superuser, Create role, Create DB, Replication, Bypass RLS | {} 有如下数据库: csumdb=> \l List of databases Name | Owner | Encoding | Collate | Ctype | Access privileges -----------+--------+----------+-------------+-------------+------------------- csumdb | csuapp | UTF8 | en_US.UTF-8 | en_US.UTF-8 | postgres | csumdb | UTF8 | en_US.UTF-8 | en_US.UTF-8 | template0 | csumdb | UTF8 | en_US.UTF-8 | en_US.UTF-8 | =c/csumdb + | | | | | csumdb=CTc/csumdb template1 | csumdb | UTF8 | en_US.UTF-8 | en_US.UTF-8 | =c/csumdb + | | | | | csumdb=CTc/csumdb (4 rows)

cLup-server第一次启动时会自动在此数据库建立相应的表和一些存储过程。

4、安装clup-agent

4.1 安装

下载clup-agent安装包:

wget https://csudata.oss-cn-hangzhou.aliyuncs.com/clup/6.0.2/clup-agent6.0.2.x86_64.bin

注意clup-agent版本与clup-server版本要对应,安装前请先检查clup-server的版本。

如需下载指定版本的clup-agent:

# 替换链接中两处"6.0.2"为目标版本号即可 # wget https://csudata.oss-cn-hangzhou.aliyuncs.com/clup/6.0.2/clup-agent6.0.2.x86_64.bin

root用户下执行下面的命令进行安装:

bash clup-agent6.0.2.x86_64.bin

安装后会产生以下目录:

  • /opt/clup-agent
  • /opt/clup-agent6.0.2

其中/opt/clup-agent 为链接文件指向“/opt/clup-agent6.0.2”目录。

4.2 配置clup-agent

clup-agent配置文件为/opt/clup-agent/conf/clup-agent.conf,这个配置文件比较简单,主要是配置了连接主程序的IP地址和密码,内容如下

# 格式为 key = value # 如果机器有多个IP得知,需要指定使用哪个网段的IP地址,如果只有一个网段IP,则不需要指定mgr_network。 # mgr_network = 192.168.160.0 # CLup服务地址和端口 server_address = 10.197.168.50:4242 #agent与CLup服务器之间通信的密码 internal_rpc_pass =XXXXXX

配置字段说明:

  • mgr_network = 192.168.160.0:当此台机器有多个不同网卡以及多个不同网段的IP地址时,此网络地址指定了内部通信走那个网段。
  • server_address = 10.197.163.30:4242 : 指定clup-server的IP地址和端口。如果是运行三个clup-server的情况下,这里需要配置三个clup-server的IP和端口,三个之间用逗号分隔。
  • agent_rpc_port = 4243: 本Agent程序的监听端口。
  • internal_rpc_pass =XXXXXX: 需要与CLup-Server主程序中的RPC密码一致,否则Agent程序无法连接CLup-Server主程序,一般可以保持默认,如需修改请先修改CLup-Server端的配置。

4.3 一些问题的解决

检查clup-agent是否能正常工作,如果报如下错误:

[root@CLup opt/clup-agent]# ./clup-agent --help /lib64/libcrypto.so.10: version `OPENSSL_1.0.2' not found (required by xxxxx)

这是因为openssl的版本太旧,查看版本:

[root@CLup opt]# rpm -qa |grep ssl openssl-1.0.2k-8.el7.x86_64 openssl-libs-1.0.2k-8.el7.x86_64 openssl-devel-1.0.2k-8.el7.x86_64

openssl版本应该是1.0.2以上的版本。
如果不是上面的版本,请运行:

yum update yum install openssl-devel

4.4 注册服务

安装过程会自动把clup-agent注册成一个服务,这个服务可以实现开机自启动的功能。

当然我们也可以手工执行命令把clup-agent注册成系统的服务,如下所示:

[root@pg01 ~]# /opt/clup-agent/bin/clup-agent reg_service 2023-05-11 06:34:16,725 INFO clup-agent v6.0.0 Copyright (c) 2019 HangZhou CSTech.Ltd. All rights reserved. 2023-05-11 06:34:16,726 INFO Start loading configuration ... 2023-05-11 06:34:16,726 INFO Complete configuration loading. Created symlink from /etc/systemd/system/multi-user.target.wants/clup-agent.service to /etc/systemd/system/clup-agent.service. register service sucessfully.

注意:可能会因为防火墙的原因或者端口开放而连接不到server端,导致注册失败,请在防火墙上开放相关端口或关闭防火墙。

4.5 启动服务

安装完后,clup-agent会自动启动。如果没有启动,我们就可以用服务的管理命令启动clup-agent,如下所示

systemctl start clup-agent

如果我们不把clup-agent注册成系统服务,则手工启动clup-agent的方法为:

/opt/clup-agent/bin/clup-agent start

在一台机器上成功启动clup-agent之后,在web管理界面中就可以看到这台机器的状态为运行中,且Agent版本会显示当前安装的Agent的版本:

4.6 停止服务

我们可以使用systemctl stop clup-agent来停止clup-agent程序,当然我们也可以使用/opt/clup-agent/bin/clup-agent stop停止clup-agent程序:

[root@CLup0 ~]# /opt/clup-agent/bin/clup-agent stop Wait 4 seconds for program stopped... Wait 4 seconds for program stopped... Wait 4 seconds for program stopped... Wait 4 seconds for program stopped... Wait 4 seconds for program stopped... clup-agent force stopped

5、自身高可用的mmn模

5.1 自身高可用说明

clup-server自身也支持高可用模式,将clup-server部署到三台机器上(通常是不同机房),可以通过任意一个clup-server来完成对平台的管理工作,坏任意一个clup-server都可以用其他的clup-server来管理平台。

高可用场景如下:

序号故障节点存活节点服务是否可用备注
11主2备会自动选择一个备节点提升为主
21备1主1备备节点重新启动服务后会自动修复
31主1备1备如果主节点机器没有问题,开机后启动clup-server服务即可恢复
42备1主只剩一个主节点时,处于选举状态,无法使用;2台备节任一故障节点恢复后,服务可以恢复正常

演示环境如下:

序号IP角色
110.198.170.11primary
210.198.170.12standby
310.198.170.13standby

5.2 CLup 高可用部署

  1. 先在主节点上部署CLup:部署方法参照 CLup6.x产品手册:快速安装

  2. 停止主节点的CLup服务

    su - clup clup-server stop
  3. 修改配置文件

    cd /home/clup/clup-server/conf # 编辑clup.conf 文件 # 修改mmn_host_list,没有的话则添加这个参数 mmn_host_list = 10.198.170.11,10.198.170.12,10.198.170.13
  4. 在两台备节点机器上部署CLup:部署方法参照 CLup6.x产品手册:快速安装

  5. 停止备节点的CLup服务

    su - clup clup-server stop
  6. 修改配置文件

    cd /home/clup/clup-server/conf # 编辑clup.conf 文件 # 修改mmn_host_list,没有的话则添加这个参数 mmn_host_list = 10.198.170.11,10.198.170.12,10.198.170.13
  7. 启动主节点上的CLup服务,然后启动备节点上的CLup服务

    # 10.198.170.11 此为当前主节点,应先启动 # clup 用户下 clup-server start # 启动10.198.170.12 10.198.170.13上的CLUP服务 # clup 用户下 clup-server start
  8. 验证,稍等片刻后再打开web页面10.198.170.11:8090,点击总览,出现下面红色线框圈选的区域即为成功

5.3 高可用验证

5.3.1 主节点故障

关闭当前CLup集群主库所在机器10.198.170.11,登录任意一台后备节点查看CLup日志

# clup 用户下 cd /home/clup/clup-serevr/logs tail -f clup-server.log 2025-12-29 14:27:34,857 ERROR Find primary csumdb(10.198.170.11) is down(1 times). 2025-12-29 14:27:44,869 ERROR Find primary csumdb(10.198.170.11) is down(2 times). 2025-12-29 14:27:54,880 ERROR Find primary csumdb(10.198.170.11) is down(3 times). 2025-12-29 14:28:04,892 ERROR Find primary csumdb(10.198.170.11) is down(4 times). 2025-12-29 14:28:14,902 ERROR Find primary csumdb(10.198.170.11) is down(5 times). 2025-12-29 14:28:24,913 ERROR Find primary csumdb(10.198.170.11) is down(6 times). 2025-12-29 14:28:34,918 ERROR Find primary csumdb(10.198.170.11) is down(7 times). 2025-12-29 14:28:44,926 ERROR Find primary csumdb(10.198.170.11) is down(8 times). 2025-12-29 14:28:54,928 ERROR Find primary csumdb(10.198.170.11) is down(9 times). 2025-12-29 14:29:04,936 ERROR Find primary csumdb(10.198.170.11) is down(10 times). 2025-12-29 14:29:04,936 ERROR csumdb(10.198.170.11) is down 2025-12-29 14:29:04,942 INFO promote csumdb(10.198.170.12) starting... 2025-12-29 14:29:04,962 INFO csumdb promote to primary

CLup检测到CLup集群当前主库异常,之后选择一个后备节点提升为主库,上面是将10.198.170.12提升为主库。

我们打开10.198.170.12:8090,登录后查看总览,可以看到当前CLup的主库已经切换到10.198.170.12上,而10.198.170.11变成一个后备节点并被标记为down。

重新启动机器10.198.170.11,检查CLup服务是否已启动:

# 10.198.170.11 clup 用户下 clup-server status # 如果服务未正常启动,则手工启动服务 clup-server start

我们再次查看总览,可以发现10.198.170.11的CLup状态依旧异常

此时我们可以查看CLup的日志,可以发现10.198.170.11的csumdb被重新搭建了,成为了10.198.170.12的一个备库

# 10.198.170.11 clup用户下 tail -f /home/clup/clup-server/conf/clup-server.log 2025-12-29 15:03:54,698 INFO the csumdb sr status is not normal, need rebuild. 2025-12-29 15:03:54,699 INFO Begin rebuild standby csumdb(10.198.170.11) from primary(10.198.170.12).. 2025-12-29 15:03:54,699 INFO Stop csumdb(10.198.170.11) 2025-12-29 15:03:54,848 INFO csumdb(10.198.170.11) is stopped 2025-12-29 15:03:54,152 INFO Use pg_basebackup rebuild csumdb(10.198.170.11).. 2025-12-29 15:03:54, 209 INFO waiting for checkpoint 2025-12-29 15:03:55,121 INFO Waiting for determine who is primary, please wait. 2025-12-29 15:04:00,956 INFO 0/727280 kB (0%), 0/1 tablespace ... 2025-12-29 15:04:11,440 INFO 727312/727312 kB (100%), 0/1 tablespace 2025-12-29 15:04:13,342 INFO Start csumdb(10.198.170.11) 2025-12-29 15:04:13,695 INFO Recheck csumdb(10.198.170.11) to primary(10.198.170.12) sr status 2025-12-29 15:04:13,707 INFO csumdb(10.198.170.11) to primary(10.198.170.12) sr status is streaning 2025-12-29 15:04:13,708 INFO Rebuild standby csumdb(10.198.170.11) from upper node(10.198.170.12) successfully

再打开10.198.170.11:8090,点击总览查看,可以发现10.198.170.11的clup集群状态也变为正常了。

5.3.2 任一备节点故障

现在将10.198.170.13(standby)机器停掉,然后登录10.198.170.11:8090查看CLup个节点的状态。

可以看到10.198.170.13这个节点的状态被标记为异常,CLup服务可以正常使用。

然后将10.198.170.13重新启动,节点状态会自动恢复正常。

6、升级

6.1 升级clup-server

升级前需要离线所有已上线的集群:
PaaS平台->数据库集群->”全选”->离线(故障集群和不可离线的集群可以忽略)

停掉CLup服务
# 使用clup用户登录安装clup-server的主机 clup-server stop clup-dhcpd stop clup-webvnc stop

提示:如果是CLup MMN部署模式, 则先停掉备用CLup节点, 最后停掉主CLup。

拷贝软件包文件到CLup主机的/home/clup下。

解压软件包
bash clup-serverX.Y.Z.x86_64.bin -z tar xf clup-serverX.Y.Z.x86_64.tar.xz

拷贝配置文件

cd /home/clup cp clup-server<上一个版本号>/conf/clup.conf clup-server/conf/.

如果之前有在报警发送方式中配置过自定义脚本,需要将其拷贝过来

cp clup-server<上一个版本号>/script*/* clup-server/scripts/.

这里写script*是为了兼容旧版本。

重新启动服务

clup-server start

如果是CLup MMN部署模式, 则先启动主CLup节点, 之后启动备用CLup节点。

如果使用虚拟机、LXC管理功能,还需要启动clup-dhcpd和clup-webvnc服务

# 可能需要再次执行: root下为clup-dhcpd服务开放1000以下端口的访问权限 setcap 'cap_net_bind_service=+ep' /home/clup/clup-server/bin/clup-dhcpd clup-dhcpd start clup-webvnc start

6.2 升级clup-agent

自动升级

拷贝新版本的clup-agent软件包到CLup主服务器特定目录下, 可在系统管理->CLUP参数设置页面中, 搜索查看agent_packages_path的值。(默认是/opt/csu_packages,可以将其修改为/home/clup/csu_packages)

进入CLup Web服务端,点击IaaS平台->主机管理->选择需要升级的主机

点击右上角Agent升级 -> 选中右上角的重启Agent -> 选择需要升级的版本,然后点击确定

升级完成后点击刷新,查看主机的状态是否恢复正常;如果自动升级未成功,需要进入主机手工操作。

手动升级

拷贝最新版的软件包到/opt目录下(如果是自动升级失败,安装包可能已经拷贝,注意查看)。

停掉clup-agent服务

systemctl stop clup-agent

如果服务未注册

cd /opt/clup-agent/bin ./clup-agent stop

解压新版软件包

bash clup-agentX.Y.Z.x86_64.bin -z tar xf clup-agentX.Y.Z.x86_64.tar.xz

拷贝配置文件

cp clup-agent<上一个版本号>/conf/clup-agent.conf /opt/clup-agent/conf/.

启动服务

systemctl start clup-agent

进入CLup管理页面查看Agent状态是否正常(IaaS平台 ->主机管理->主机列表 状态和Agent版本)。

在浏览器输入 http://IP:8090 ,打开WEB界面

Clup安装脚本使用手册

Clup简介https://www.csudata.com/clup/manual

http://www.jsqmd.com/news/855598/

相关文章:

  • 华为、华三、思科、锐捷网络设备远程登录配置
  • 5.20学习内容
  • Android 音视频开发深度解析:从基础原理到面试实战
  • 2026全栈自动化测试避坑指南:别让过时的“面试经”毁了你的竞争力
  • 软件工程师在智能体视觉时代的机遇(20)
  • 【Java+AI】Java正在悄然“杀死“Python的AI霸权——虚拟线程与GraalVM如何重写企业级AI推理规则
  • 多模态RAG工程实践:图片、表格、文档混合检索的完整方案
  • 2026年知名的腕表/智能定位腕表长期合作厂家推荐 - 行业平台推荐
  • Python WAV音频压缩完全指南:从有损到无损的全方案实现
  • 小佩宠物饮水机拆机分析报告
  • 从Claude Code到AI编程全家桶:Cursor、OpenClaw、Codex、Gemini等主流工具深度横评
  • 从‘功能域’到‘位置域’:手把手拆解汽车EEA中的Zonal控制器设计要点
  • FPGA设计避坑指南:Vivado里那些红色和橙色的时钟交互框到底意味着什么?
  • [Note]KM最优匹配,匈牙利算法介绍
  • GNSS模块教程:大夏龙雀 DX-GP21,从硬件接线到 NMEA 数据解析
  • 五分钟完成Python环境配置,用Taotoken调用大模型API
  • 拒绝扁平化噩梦!VLAN 三大核心优势深度拆解:从广播风暴到零信任安全架构的实战进化论
  • 信息安全数学基础-第一章学习笔记
  • 【2026 新版】Open Claw v 2.7.5 电脑端极速部署实操指南
  • brpc异步请求封装
  • 开源软件的发展现状与未来趋势:软件测试从业者的视角
  • 毕业设计精选【芳心科技】12V锂电池充放电管理系统
  • 全球主流软件选型盘点:深度解析erp系统主要干什么的,以及高增长企业里的erp系统主要干什么的
  • 恍如宋朝的回门宴
  • 别再只用ReLU了!手把手教你为BP神经网络选激活函数(附Java代码避坑指南)
  • 2026春季下学期第十二周
  • C语言的意思
  • [ 计算机网络 | 第二章 ] 物理层
  • Transformer 核心模块详解:多头注意力、前馈网络与词嵌入
  • cp520靶场学习笔记