发生版本
【GaussDB(DWS)】【6.5.1】
问题描述
添加主机成功后页面出现37014 gaussdb进程锁文件已经存在的告警
问题分析
cma的启停线程在start_datanode_check逻辑,判断进程不存在之后,会检查是否有gs_ctl在运行,如果有gs_ctl运行,会sleep(2)用来让gs_ctl build在执行的时候,有足够的时间创建gs_build.pid文件。这样会造成一个问题,2s前检测到dn进程不存在。进入进程不存在的判断逻辑,DN START,但是此时有概率dn在进行build,这个时候,会sleep(2),2s之后dn进程成功启动,cma再次拉起。
解决方案
按如下步骤可消除告警:
1、先根据告警信息找到上报告警的dn对应的目录
2、把目录下的postmaster.pid文件移到其他地方
3、然后在kill出问题的dn对应的进程
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316536.html