【集群启停】dn手动停止之后再次启动时启动不了

【问题现象】

现场出于某种原因主动停止了一个主dn,然后一段时间后重新去启动此dn,但是启动不起来,ps查进程也没看到相应进程启动。

【排查过程】

  1. 排查对应节点上systemcall日志,发现有如下报错,怀疑数据目录权限不为700导致

    image.png

  2. 排查对应数据目录权限,确认权限高于700,且同时发现其它dn实例的数据目录权限也高于700,一旦重启也会出现启动不了的情况

image.png

3.与现场人员沟通确认此前业务侧为了监控各个数据目录大小,手动修改了数据目录权限,将数据目录权限恢复为700之后启动正常。

【解决方法】

将数据目录权限恢复为700,然后重新启动即可。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316651.html

(0)
上一篇 2025年10月29日 23:31
下一篇 2025年10月29日 23:33

相关推荐

发表回复

登录后才能评论