GaussDB(DWS)添加主机成功后页面出现37014 Gaussdb进程锁文件已经存在的告警

发生版本

【GaussDB(DWS)】【6.5.1】

问题描述

添加主机成功后页面出现37014 gaussdb进程锁文件已经存在的告警

问题分析

cma的启停线程在start_datanode_check逻辑,判断进程不存在之后,会检查是否有gs_ctl在运行,如果有gs_ctl运行,会sleep(2)用来让gs_ctl build在执行的时候,有足够的时间创建gs_build.pid文件。这样会造成一个问题,2s前检测到dn进程不存在。进入进程不存在的判断逻辑,DN START,但是此时有概率dn在进行build,这个时候,会sleep(2),2s之后dn进程成功启动,cma再次拉起。

解决方案

按如下步骤可消除告警:

1、先根据告警信息找到上报告警的dn对应的目录

2、把目录下的postmaster.pid文件移到其他地方

3、然后在kill出问题的dn对应的进程

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316536.html

(0)
上一篇 2025年10月29日 22:56
下一篇 2025年10月29日 22:57

相关推荐

发表回复

登录后才能评论