Oracle ASM 磁盘组 dismount 显示 “Waited 15 secs for write IO to PST”

如果自己搞不定可以找诗檀软件专业ORACLE数据库修复团队成员帮您恢复!

诗檀软件专业数据库修复团队

服务热线 : 13764045638 QQ号:47079569 邮箱:service@parnassusdata.com

 

适用于:

Oracle Database – Enterprise Edition – 版本 11.2.0.3 到12.1.0.1 [Release 11.2 to 12.1]
本文信息适用于任何平台。

症状

 

正常或高冗余磁盘组被dismounted ,显示这些警告消息。

//ASM alert.log
Mon Jul 01 09:10:47 2013
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 1 in group 6.
WARNING: Waited 15 secs for write IO to PST disk 4 in group 6.
….
GMON dismounting group 6 at 72 for pid 44, osid 8782162

 

 

原因

通常这类信息在以下情况下出现在ASM 警告日志文件中,

延迟的 ASM PST 在正常或高冗余磁盘组上的ASM磁盘上心跳,
因此ASM实例dismount磁盘组。默认下,它是15秒。

 

顺便说下,对于外部冗余磁盘组,心跳延迟有点被忽略。
ASM 实例停止发出更多PST 心跳直到它成功完成PST 重新验证,
但心跳延迟不直接dismount外部冗余磁盘组。

通过在以下情况中,ASM 磁盘可能无响应:

+    多路径失败的物理路径的其中一些脱机或丢失
+    在一个多路径设置中路径 ‘failover’
+    服务器负载,或任何类型的存储/多路径/OS维护

 

Doc ID 10109915.8 简述了Bug 10109915(该修复引入了这个underscore参数)。且在Hung NFS Server/Filer 的情况中,问题是没有OS/存储可调超时timeout机制的。然后,_asm_hbeatiowait 帮助设置time out。

 

 

解决方案

1]    与OS 和Storage 管理员确认有无磁盘无响应。

2]    尽可能保持磁盘响应在15秒以下。

这取决于多个因素,如
+    操作系统
+    多路径(和多路径类型)的存在
+    任何内核参数

所以你要搞清楚你的设置的磁盘无响应的’maximum’是多少。

例如,在AIX上 rw_timeout 设置影响这一点,且默认为30秒。

另一个例子是原生多路径的Linux。在这样的设置中,物理路径的数量和multipath.conf文件中的POLLING_INTERVAL值将决定这个最大磁盘无响应。

所以对于你的设置(OS / 多路径/ 存储的组合),你需要找到这个。

3]    如果你不能保持磁盘无响应在15秒以下,则可以在ASM实例(在RAC的所有节点上)中设置以下参数:

_asm_hbeatiowait

对于每个内部17274537 ,基于内部尝试,应该将值增加到120秒,这在12.1.0.2中被修复

 

在asm实例中运行以下来设置_asm_hbeatiowait所需的值

alter system set “_asm_hbeatiowait”=<value> scope=spfile sid=’*’;

然后重启asm 实例/ crs,使新参数值生效。

Comment

*

沪ICP备14014813号

沪公网安备 31010802001379号