当前位置: 首页 > news >正文

如何排查RAC节点被驱逐Eviction_CSS日志与宕机重启原因分析

ocssd.log 是诊断节点驱逐的首要日志,需优先检查“misscount exceeded”(私网心跳中断)或“disk timeout”(表决盘I/O失败)等关键错误,并确认时间同步、表决盘可达性及ocssd.bin崩溃信号。看 ocssd.log 里有没有 “misscount exceeded” 或 “disk timeout”节点被驱逐,ocssd.bin 是最终执行者,它的日志最直接。别急着翻 alert.log 或系统日志,先去 $grid_home/log/<hostname>/cssd/ocssd.log 找关键线索。如果看到 misscount exceeded、network heartbeat failure 或类似提示,基本锁定是私网通信中断或延迟超标(默认 misscount=30 秒,即连续 30 次没收到心跳)如果看到 disk timeout、voting file I/O error、CRS-1606,说明磁盘心跳失败,问题出在表决盘(voting disk)的读写上,可能是 ASM 延迟、存储链路抖动、裸设备权限错,或触发了 Bug 13869978(11.2.0.3.4 之前版本高发)注意时间戳:必须确认日志报错时间早于节点重启时间;否则就是“后见之明”,不是真因查网络心跳前先确认时间同步是否真实可靠时间不同步会直接导致 CSS 认为心跳超时——哪怕网络完全正常。CTSS(Cluster Time Synchronization Service)日志里出现异常返回值,或者 ntpq -p 显示 offset > 1000ms(比如你见过的 11376 ms),就已是强信号。别只改 NTP 配置:BIOS 时间也得同步,否则重启后又漂移检查时间源是否指向新环境的 NTP 服务器,旧数据中心的时间源在新网络下可能不可达或响应极慢crsctl check ctss 返回 ACTIVE: time synchronizer active 才算真正生效;若为 INACTIVE,CTSS 实际已退化为“观察模式”,不干预但也不校正用 crsctl query css votedisk 和 dd if=<vote-device> of=/dev/null count=1 bs=4k 验证表决盘可达性表决盘不是“配好就行”的静态配置,它每秒都在被读写。很多驱逐看似突发,实则是某块投票盘 I/O 卡顿超过 200 秒(disktimeout 默认值),CSSD 主动自毁保数据。 WisPaper 复旦大学研发的AI学术搜索工具,5分钟内筛选1000篇论文

http://www.jsqmd.com/news/630006/

相关文章:

  • OpCore Simplify完全手册:零基础构建完美Hackintosh系统的终极教程
  • Graph Wavelet Neural Network (GWNN) 实战:如何在Cora数据集上实现高效节点分类
  • ADC测量不准?可能是Vref惹的祸!手把手教你用万用表校准参考电压
  • 动态水印:为LLM生成内容打造可追溯与语义无损的隐形标记
  • 4K@60Hz带宽不够用?详解HDMI2.1的FRL模式与传统TMDS差异(含实测数据对比)
  • Rustup终极指南:如何快速安装和管理Rust工具链
  • 保姆级教程:OpenWrt 21.02升级,用sysupgrade还是mtd?看完这篇再也不纠结
  • 政务工作流实战——突破Activiti的五个关键决策(综述)
  • LVGL嵌入式UI中文显示实战:从字体生成到界面优化
  • 基于dq解耦控制的STATCOM研究:PI控制与无差拍控制的对比分析
  • 记一次综合型流量分析 | 添柴不加火衅
  • 告别OFDM?聊聊6G候选波形AFDM在车联网感知中的独特优势与仿真对比
  • 手把手教你写Python节点:将ROS的Twist消息转换为阿克曼模型的Gazebo控制指令
  • SpringAI与Ollama:Java开发者如何轻松构建本地LLM应用
  • TimesNet:解锁时间序列多周期性奥秘的二维建模新范式
  • 基于深度学习的YOLO11飞鸟识别系统 飞鸟图像分割识别系统附代码 飞鸟识别数据集 空中威胁识别系统
  • 从魔方到代码:手把手教你用Python实现科先巴二阶段算法(附完整源码)
  • Windows Cleaner:3步解锁C盘空间,让Windows告别卡顿时代
  • Qwen3-ASR-1.7B开源ASR模型教程:模型路径/root/ai-models/Qwen/定位与替换
  • 网页时光机深度解析:让互联网记忆永不消失的浏览器扩展
  • 别再死记硬背了!用Multisim仿真带你5分钟搞懂OTL、OCL功放电路的区别
  • 延凡低成本低空无人机AI巡检方案
  • 深度探索HackRF射频架构:从系统集成到性能优化的技术解析
  • MKS Monster8 8轴主板终极指南:如何为Voron 2.4构建高性能3D打印控制系统
  • Virtuoso新手必看:从反相器到2-4译码器的完整电路仿真流程(附HSPICE配置)
  • OpenAI获1220亿美元融资,估值达8520亿美元创纪录 | AI信息日报 | 2026年4月12日 星期日
  • 2026q2四川球场厂家地址解析:运动球场跑道/防静电地板/防静电高架地板/防静电高架陶瓷地板/epdm球场/选择指南 - 优质品牌商家
  • 视频内容创作利器:Chord工具帮你自动生成视频脚本与场景描述
  • OpenCore-Configurator:告别复杂配置,让黑苹果引导变得简单直观
  • ShawzinBot完整教程:5分钟实现Warframe自动音乐演奏