【问题现象】
现场出于某种原因主动停止了一个主dn,然后一段时间后重新去启动此dn,但是启动不起来,ps查进程也没看到相应进程启动。
【排查过程】
- 排查对应节点上systemcall日志,发现有如下报错,怀疑数据目录权限不为700导致

- 排查对应数据目录权限,确认权限高于700,且同时发现其它dn实例的数据目录权限也高于700,一旦重启也会出现启动不了的情况

3.与现场人员沟通确认此前业务侧为了监控各个数据目录大小,手动修改了数据目录权限,将数据目录权限恢复为700之后启动正常。
【解决方法】
将数据目录权限恢复为700,然后重新启动即可。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316651.html