Oracle 互联故障/修复之后,被 Evict节点不会正常启动

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线 : 13764045638 QQ号:47079569 邮箱:[email protected]

 

运行中的RAC环境中,发生了互联故障,Split brain中节点被Evict (排除)时,重启时(以没有解决互联故障的状态)CSS无法正常启动。另外,即使修复互联故障,但无法重启OS是,就无法识别修复,陷入同样的循环。

Evict的节点重启时, ocssd.log输出以下内容。

ocssd.log
—-
>TRACE: clssnmRcfgMgrThread: Local Join
>WARNING: clssnmLocalJoinEvent: takeover aborted due to ALIVE nodeon Disk
>TRACE: clssnmReadDskHeartbeat: node(1) is down. rcfg(10) wrtcnt(61895) LATS(4294137210) Disk lastSeqNo(61895)

[适用版本]
发生问题的版本 :Oracle Database 10g Release2(10.2.0.4)
Oracle Database 10g Release2(10.2.0.3) + Bug 4930431 の应用修复的环境
修复问题的版本 :Oracle Database 11g Release1
预定修复问题的办不办:无
已修复问题的PSR :PSR10.2.0.5
预定修复问题的PSR :无

※ 11.1.0.6中各个平台的修复情况如下所示。
修复完成: Linux x86-64, Solaris, HP-UX, IBM AIX Based Systems
未修正 : Linux x86, Windows
未修正的平台 11.1.0.7 修复完成。
[适用平台]
所有平台

[可能发生的条件]
– RAC运行中的环境中,发生互联故障,之后重启时还会发生相同的故障

[原因]
节点重启时,无法经过互联来交换信息时,就无法交换信息,还会导致持续尝试加入到cluster中。
另外,即使修复互联故障,只有不重启OS,就无法检测到修复,就会持续尝试加入cluster

[对策]
修复互联故障,重启OS后,请启动Oracle Clusterware。
[补充事项]
修复了本问题的版本中,某段时间无法加入cluster时, CSS自身进行Exit。
[BUG番号]
Bug 6403258


Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *