从vCenter 6.7到7.0:一次平滑升级的实战避坑指南
1. 升级前的关键准备工作
升级vCenter就像给房子做装修,准备工作没做好,后期可能满地狼藉。我在实际项目中帮客户升级过二十多次vCenter,发现90%的问题都出在准备阶段。先说说最容易踩坑的几个地方:
第一是备份策略。虽然官方文档说可以只做快照,但我强烈建议同时做两种备份:虚拟机快照+配置文件导出。去年有个客户因为存储故障导致快照恢复失败,最后靠配置文件备份才挽回局面。具体操作很简单:
# 导出vCenter配置 /usr/lib/vmware-vmware-vmon/vmon-cli --stop-all /usr/lib/vmware-vmware-vmon/vmon-cli --backup-config /backup/vcenter_config第二是环境兼容性。vCenter 7.0对部署架构有硬性要求:
- 不再支持SSO分离部署(必须合并)
- 要求ESXi主机版本至少6.5以上
- 需要8GB以上内存(实测12GB更稳妥)
建议用这个命令检查环境:
# 检查当前vCenter部署模式 /usr/lib/vmware-vmafd/bin/vmafd-cli get-site-name --server-name localhost第三是临时IP规划。这个临时IP必须满足:
- 与旧vCenter同网段
- 未被DHCP分配
- 能访问相同网关/DNS 我习惯提前在交换机上做IP-MAC绑定,避免被意外占用。
2. 升级过程中的实战技巧
2.1 安装介质的选择与验证
很多人直接拿官网下载的ISO就开干,结果遇到哈希校验失败。我的经验是:
- 下载后立即验证SHA256:
shasum -a 256 VMware-VCSA-all-7.0.0-15952498.iso - 使用USB 3.0闪存盘制作启动介质(比光盘更可靠)
- 提前测试ISO能否正常挂载
2.2 图形界面安装的隐藏选项
安装向导有几个容易忽略的配置点:
- 磁盘模式选择:厚置备延迟置零(性能最好)
- 部署规模:小型环境选"Tiny"反而容易资源不足
- 临时IP设置:建议禁用IPv6(减少兼容性问题)
实测发现,如果在NTP服务器栏填写:
pool.ntp.org,time.nist.gov能显著改善升级后的时间同步问题。
3. 数据迁移的避坑指南
3.1 选择性迁移的艺术
迁移数据时有个隐藏陷阱:全选所有数据会导致:
- 迁移时间延长3-5倍
- 可能触发vPostgres数据库锁死 我的建议配置是:
- 必选:配置和清单
- 可选:任务和事件(保留30天)
- 不选:性能指标(可后期重建)
3.2 服务启动顺序优化
新vCenter启动服务时,按这个顺序手动操作更稳定:
- vpxd(核心服务)
- vpostgres(数据库)
- vsphere-ui(Web界面) 可以用命令监控:
service-control --status --all4. 升级后的必做检查项
4.1 证书与协议调整
vCenter 7.0强制使用TLS 1.2,需要检查:
- 登录控制台执行:
/usr/lib/vmware-vmon/vmon-cli --update-tls-versions - 验证协议状态:
openssl s_client -connect localhost:443 -tls1_2
4.2 许可证的玄学问题
遇到过最诡异的情况:许可证显示有效但告警不断。解决方案是:
- 删除所有许可证
- 重启vCenter服务
- 重新添加许可证 关键命令:
/usr/lib/vmware-vmware-vmon/vmon-cli --restart vpxd5. 常见故障应急方案
5.1 回滚操作的特殊技巧
如果升级失败需要回滚:
- 不要直接恢复快照!
- 先关闭新vCenter电源
- 在旧vCenter执行:
/usr/lib/vmware-vmware-vmon/vmon-cli --start-all
5.2 网络不通的排查流程
遇到无法访问时:
- 检查端口组是否匹配:
esxcli network vswitch standard portgroup list - 验证防火墙规则:
iptables -L -n | grep 443
有次升级后所有虚拟机显示"已断开连接",其实是VMware Tools版本不兼容。解决方案是先在旧环境统一升级Tools到最新版再执行vCenter升级。
