【问题现象】
1、现场单实例故障,手动拉起build实例后实例状态显示build failed,反复重试后此问题仍然存在
2、某节点所有实例down unkown与starting状态来回切换
【原因分析】
1、现场查看gs_ctl 日志无报错,异常中断

2、现场手动拉起build后发现gs_ctl进程报错退出,查看此节点进程存在停止此节点命令
3、查看父进程调用为mpp-stop.sh脚本调起

4、此脚本为线下纯软版本慢节点检测特性,现场将此脚本停止节点功能注释后重新拉起
注:集群升级补丁等变更会使用此脚本,待build完成后需要回退

5、注释以上脚本后重新拉起build正常,待build完后回退即可
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316730.html