Oracle 互联故障/修复之后，被 Evict节点不会正常启动

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线： 13764045638 QQ号:47079569 邮箱：[email protected]

运行中的RAC环境中，发生了互联故障，Split brain中节点被Evict (排除)时，重启时(以没有解决互联故障的状态)CSS无法正常启动。另外，即使修复互联故障，但无法重启OS是，就无法识别修复，陷入同样的循环。

Evict的节点重启时， ocssd.log输出以下内容。

ocssd.log
—-
>TRACE: clssnmRcfgMgrThread: Local Join
>WARNING: clssnmLocalJoinEvent: takeover aborted due to ALIVE nodeon Disk
>TRACE: clssnmReadDskHeartbeat: node(1) is down. rcfg(10) wrtcnt(61895) LATS(4294137210) Disk lastSeqNo(61895)

[适用版本]
发生问题的版本：Oracle Database 10g Release2(10.2.0.4)
Oracle Database 10g Release2(10.2.0.3) + Bug 4930431 の应用修复的环境
修复问题的版本：Oracle Database 11g Release1
预定修复问题的办不办：无
已修复问题的PSR ：PSR10.2.0.5
预定修复问题的PSR ：无

※ 11.1.0.6中各个平台的修复情况如下所示。
修复完成: Linux x86-64, Solaris, HP-UX, IBM AIX Based Systems
未修正 : Linux x86, Windows
未修正的平台 11.1.0.7 修复完成。
[适用平台]
所有平台

[可能发生的条件]
– RAC运行中的环境中，发生互联故障，之后重启时还会发生相同的故障

[原因]
节点重启时，无法经过互联来交换信息时，就无法交换信息，还会导致持续尝试加入到cluster中。
另外，即使修复互联故障，只有不重启OS，就无法检测到修复，就会持续尝试加入cluster

[对策]
修复互联故障，重启OS后，请启动Oracle Clusterware。
[补充事项]
修复了本问题的版本中，某段时间无法加入cluster时， CSS自身进行Exit。
[BUG番号]
Bug 6403258

Oracle 互联故障/修复之后，被 Evict节点不会正常启动

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线： 13764045638 QQ号:47079569 邮箱：[email protected]

Comments