[原]解决Failed 3 to bind listening endpoint错误

   今天收到客户的报障,一套两台部署了Oracle 10g R2 RAC的系统,其中一台主板损坏,更换的主板。但更换后,该机器CRS服务无法正常启动。经咨询,除因更换主板后,网卡MAC地址改变,而重新配置了网络外,本地配置没有做改动。

一、故障现象
到场后,才发现系统是:红帽 AS 4.0 Update 2的。从日志上看到如下报错:

引用
/var/log/messages:
Cluster Ready Services waiting on dependencies.Diagnostics in /tmp/crsctl.11059

再追踪到/tmp/crsctl.11059,有:

引用
Failed 3 to bind listening endpoint:(ADDRESS=(PROTOCOL=tcp)(HOST=prv2)

由此,怀疑是更换主板后,网络配置带来的影响。

二、故障解决
查看/etc/sysconfig/network-scripts/ifcfg-eth0和ifcfg-eth1文件,对比集群中另一台机器db02,IP设置正确;查看主机名,设置正确;查看/etc/hosts文件,发现只保留下面的信息:

引用
127.0.0.1               localhost.localdomain localhost

由于Oracle启动listener默然使用主机名对应,怀疑是hosts文件错误,导致主机名和IP对应失败。
从db02拷贝hosts的内容到本机:

引用
127.0.0.1       localhost.localdomain   localhost
# Public Network – (eth0)
219.142.7.143   ora01
219.142.7.144   ora02

# Private Interconnect – (eth1)
10.0.0.1   int-ora01
10.0.0.2    int-ora02

# Public Virtual IP (VIP) addresses for – (eth0)
219.142.7.201    vip-ora01
219.142.7.202    vip-ora02

重启init.crs服务:

# service init.crs start

启动正常,故障解决。
※后续:引起问题的原因,怀疑是Redhat的gnome网络配置工具,在配置网络信息后,把/etc/hosts文件恢复到初始状态,而丢失了RAC必须的主机名-IP配置关系表。但时间关系,没进一步深究。

Oracle Database 10g R2/11g R2 Win/Linux 版本迅雷下载【中转】
Asianux 3.0 安装Oracle 11g R2界面失去响应的问题
本地终端无法登陆系统故障
构建Heartbeat 2.1.3 GUI+DRBD+Oracle 10g 双机互备集群
Oracle的SGA与系统vm.nr_hugepages不匹配导致的故障

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/112304.html

(0)
上一篇 2021年8月27日
下一篇 2021年8月27日

相关推荐

发表回复

登录后才能评论