当前位置: 首页 > news >正文

如何分析RAC启动挂起_crond与ohasd进程启动依赖链排查

ohasd.bin 启动卡住时,应先删除残留的 /var/tmp/.oracle/npohasd 管道文件,再执行 crsctl start crs;需确认目录权限正确、检查 ohasd.log 与 ocssd.log 中超时及磁盘识别问题,并验证 crsctl check has 状态是否为 online。ohasd.bin 启动卡住时,先看 /var/tmp/.oracle/npohasd 是否残留oracle 11g rac(尤其是 11.2.0.4)启动失败最常见的表象是 crsctl start crs 卡住、无输出,ps -ef | grep ohasd.bin 显示进程存在但状态僵死,日志里反复出现 timed out waiting for ohasd monitor。这不是配置错误,而是启动机制被一个 unix 命名管道文件阻塞了。/var/tmp/.oracle/npohasd 是 ohasd.bin 启动时创建的 IPC 通信通道,正常启动后由 monitor 进程接管;若上次异常退出未清理,新进程会尝试读取该管道并无限等待直接删掉它:rm -f /var/tmp/.oracle/npohasd,再执行 crsctl start crs,90% 以上能立刻恢复注意权限:该目录属 root:root,普通用户删不掉;且不能只删 npohasd 而留空目录——/var/tmp/.oracle/ 必须存在且权限为 drwxr-xr-x确认 ohasd 是否真在运行,别被 ps 的假象骗了ps -ef | grep ohasd.bin 看到进程号 ≠ 它在正常工作。真正要验证的是它的子进程链和监控状态。用 crsctl check has 查真实状态,返回 CRS-4638: Oracle High Availability Services is online 才算成功;若报 CRS-4639: Could not contact Oracle High Availability Services,说明 ohasd 根本没活过来检查 ohasd.log(路径:$GRID_HOME/log/<hostname>/ohasd/ohasd.log),重点搜 OHASD00117 和 reboot 字样——前者是超时标志,后者说明进程被强制重启过但失败不要依赖 systemctl status oracle-ohasd(RHEL7+ 上可能显示 active,但实际内部已 hang);ohasd 是 init 进程(PID 1 的子进程),它不走 systemd 生命周期管理从 ocssd 日志反推依赖链断裂点ohasd 启动后,按固定顺序拉起 cssd → crsd → evmd → asm。一旦卡在中间,ocssd.log 是第一个暴露问题的现场。查 $GRID_HOME/log/<hostname>/cssd/ocssd.log,看最后几行是否卡在磁盘发现阶段,例如反复打印 Fetching UFS disk :/dev/raw/raw1: ——这说明 ASM 磁盘路径不可达或权限不对,cssd 无法完成集群成员资格校验,后续全部阻塞常见诱因:/dev/raw/* 设备消失(UDEV 规则失效)、ASM 磁盘权限不是 grid:asmadmin、OCR/Voting Disk 所在磁盘未被识别此时别急着重启整个集群,先手动跑一遍磁盘扫描:udevadm trigger + ls -l /dev/raw/ 确认设备存在,再试 crsctl start crs为什么 crond 会被牵连?它其实只是背锅侠标题里提到 crond,但它和 RAC 启动挂起基本无关——除非你误把 GI 自动启动脚本加进了 crontab,或者 crond 自身崩溃导致系统级定时任务紊乱(极罕见)。 Bolt.new Bolt.new是一个免费的AI全栈开发工具

http://www.jsqmd.com/news/668485/

相关文章:

  • AGI已具备自主渗透能力:实测5大主流AGI模型在红蓝对抗中触发RCE的4种新型利用链
  • AGI因果能力评估白皮书(工信部AI安全重点实验室内部版·限发200份)
  • 告别BDC!用BAPI_ACC_DOCUMENT_POST+SAP增强搞定资产、票据等特殊总账凭证
  • 2026届学术党必备的五大降AI率网站解析与推荐
  • 2.1VMware部署Windows_server_2008_R2
  • Golang slice扩容机制原理_Golang切片扩容教程【高效】
  • (小林coding)MySQL有哪些锁,他们各自的特点是什么
  • CentOS7上从源码编译Zabbix 6.0,我踩过的那些坑和最佳实践
  • Matlab图像处理实战:用flip函数轻松搞定图像翻转、镜像与数据增强
  • c++如何处理文件路径中由于不规范的连续斜杠导致的路径解析错误【避坑】
  • 从ZkClient到Curator:Spring Boot项目里ZooKeeper客户端选型与实战避坑指南
  • 告别官方限制:在Manjaro/Arch上为罗技鼠标解锁LogiOps驱动的完整配置流程
  • 告别Navicat!JetBrains DataGrip 2024.1 保姆级安装与中文汉化指南(附时区问题解决)
  • 如何设置密码复杂度策略以约束MongoDB用户的密码强度
  • Apache Guacamole实战:将远程桌面无缝集成到SpringBoot管理后台
  • 当模数只有50万:从‘球与盒子’问题聊聊竞赛中那些‘不寻常模数’的坑与技巧
  • 代码重构技巧:改善既有代码的设计
  • 别再死记硬背A*算法了!用Python实战8数码问题,手把手教你理解曼哈顿距离的威力
  • 从fmax到qsort:解锁C语言内置工具函数的实战效能与设计哲学
  • 别再只会用Base64了!手把手教你用Python魔改码表,打造自己的“加密”工具
  • 别再手动传配置了!用3CDaemon+SecureCRT给H3C交换机传文件的保姆级教程
  • 【AGI物理交互能力跃迁指南】:20年机器人AI专家揭秘3大硬件耦合瓶颈与5步落地路径
  • Agent 的可解释性怎么做:从决策轨迹到证据引用的产品化
  • 【AGI时代分水岭】:SITS2026正式发布——全球首个面向生产级AGI的多维能力基准测试体系(附权威评测白皮书下载通道)
  • 【卷卷观察】Accel 募集 50 亿美元,硅谷 VC 正在用真金白银回答一个问题
  • 避开Boost电路设计的那些‘坑’:用STM32驱动IGBT,你的栅极电阻和霍尔传感器选对了吗?
  • 网络工程师-实战配置篇(一):深入 BGP 与 VRRP,构建高可靠网络
  • 龙虾配置文件之TOOLS.md 源码分析与配置指南
  • 别再死记硬背了!用Visual Studio 2022创建第一个WinForm窗体的保姆级避坑指南
  • 快速入门python学习笔记