[原]解决IBM x460网络ping故障

   客户反应,由两套IBM x460组成的Oracle 10g RAC集群,出现ping任何IP地址,都会出现0.000ms的故障。
一、故障描述
◎硬件架构:
每套x460是由两台x460堆叠而成的,每台带1块双口的网卡,也就是一套4个口,实际使用到其中的2个口,一个接路由器,一个接交叉线连接到另外一套中,做心跳。
每套带两块HBA卡,连接到DS4300盘柜中,实现冗余。
◎软件架构:

引用
操作系统:红旗 DC Server 5.0 for x86_64 SP1
应用:Oracle 10g R2 RAC

◎现在遇到的问题是:
ping 机器IP(127.0.0.10)、本机IP和对方的心跳IP地址,都会出现很明显的延迟,5ms以上。
其中还会出现一些0.000ms的信息。

引用
# ping 127.0.0.1
PING 127.0.0.1 (127.0.0.1) 56(84) bytes of data.
64 bytes from 127.0.0.1: icmp_seq=0 ttl=64 time=3.75 ms
64 bytes from 127.0.0.1: icmp_seq=1 ttl=64 time=5.52 ms
64 bytes from 127.0.0.1: icmp_seq=2 ttl=64 time=3.84 ms
64 bytes from 127.0.0.1: icmp_seq=3 ttl=64 time=0.000ms
64 bytes from 127.0.0.1: icmp_seq=4 ttl=64 time=4.41 ms
64 bytes from 127.0.0.1: icmp_seq=5 ttl=64 time=6.25 ms

— 127.0.0.1 ping statistics —
6 packets transmitted, 6 received, 0% packet loss, time 11091ms
rtt min/avg/max/mdev = 0.084/0.092/0.107/0.009 ms, pipe 2

本机IP:
点击在新窗口中浏览此图片点击在新窗口中浏览此图片二、故障解决
1、升级网卡驱动
参考IBM的官方资料,把原bcm5700驱动升级为tg3,并屏蔽不用的两个网卡;
修改/etc/modprobe文件,把:

改为:

※可使用mii-tool或ethtool工具确认网卡是否处于联通状态。
2、升级核心
单纯升级网卡驱动,未能解决问题,故决定升级到SP2核心。

而从SP2核心开始,自带两个qla2300驱动,一个支持failover,另外一个不支持。所以,需要修改/etc/modprobe.conf文件;
把:

修改为:

※可参考/lib/modules/2.6.9-42.7AXsmp/kernel/drivers/scsi/中的qla2xxx和qla2xxxfo目录信息
最后,重新初始化initrd.img文件:

保存后,重启服务器,并选择从新核心启动。故障解决。
◎若确认新核心能正常使用,可修改/boot/grub/menu.lst文件的核心启动顺序。

三、回顾
该问题,应是旧核心无法正确识别x460的硬件架构导致的。其他x系列机器,没发现类似的故障。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/112911.html

(0)
上一篇 2021年8月27日
下一篇 2021年8月27日

相关推荐

发表回复

登录后才能评论