今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。
一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059
再追踪到/tmp/crsctl.11059,有:
由此,怀疑是更换主板后,网络配置带来的影响。
二、故障解决
查看/etc/sysconfig/network-scripts/ifcfg-eth0和ifcfg-eth1文件,对比集群中另一台机器db02,IP设置正确;查看主机名,设置正确;查看/etc/hosts文件,发现只保留下面的信息:
由于Oracle启动listener默然使用主机名对应,怀疑是hosts文件错误,导致主机名和IP对应失败。
从db02拷贝hosts的内容到本机:
# Public Network – (eth0)
219.142.7.143 ora01
219.142.7.144 ora02
# Private Interconnect – (eth1)
10.0.0.1 int-ora01
10.0.0.2 int-ora02
# Public Virtual IP (VIP) addresses for – (eth0)
219.142.7.201 vip-ora01
219.142.7.202 vip-ora02
重启init.crs服务:
启动正常,故障解决。
※后续:引起问题的原因,怀疑是Redhat的gnome网络配置工具,在配置网络信息后,把/etc/hosts文件恢复到初始状态,而丢失了RAC必须的主机名-IP配置关系表。但时间关系,没进一步深究。
Asianux 3.0 安装Oracle 11g R2界面失去响应的问题
本地终端无法登陆系统故障
构建Heartbeat 2.1.3 GUI+DRBD+Oracle 10g 双机互备集群
Oracle的SGA与系统vm.nr_hugepages不匹配导致的故障
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/112304.html