GaussDB(DWS)【集群故障】build拉起一段时间后退出

【问题现象】

1、现场单实例故障,手动拉起build实例后实例状态显示build failed,反复重试后此问题仍然存在

2、某节点所有实例down unkown与starting状态来回切换

【原因分析】

1、现场查看gs_ctl 日志无报错,异常中断

GaussDB(DWS)【集群故障】build拉起一段时间后退出

2、现场手动拉起build后发现gs_ctl进程报错退出,查看此节点进程存在停止此节点命令GaussDB(DWS)【集群故障】build拉起一段时间后退出

3、查看父进程调用为mpp-stop.sh脚本调起

GaussDB(DWS)【集群故障】build拉起一段时间后退出

4、此脚本为线下纯软版本慢节点检测特性,现场将此脚本停止节点功能注释后重新拉起

注:集群升级补丁等变更会使用此脚本,待build完成后需要回退

GaussDB(DWS)【集群故障】build拉起一段时间后退出

5、注释以上脚本后重新拉起build正常,待build完后回退即可

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316730.html

(0)
上一篇 2025年10月29日 23:46
下一篇 2025年10月29日 23:50

相关推荐

发表回复

登录后才能评论