一、故障现象

manager无法登录,查看oms状态,iam组件为exception状态;操作系统为麒麟v10或欧拉2.9;数据库版本为8.1.1

1.png

二、问题原因

1.iam组件启动,需要连接oms节点的数据库

2.查看/var/log/Bigdata/omm/oms/db/omm_gaussdba.log,报错decrypt str:[******] failed

2.png

3.以上解密报错的原因是因为解密过程需要使用/tmp目录,麒麟v10和欧拉2.9对该目录做了特别处理

3.png

三、解决方法

1.修改目录“/tmp”的权限,去掉粘滞位(sticky bit)

4.png

2.修改后,oms状态可以恢复,但是页面会有/tmp目录权限的告警,该问题是8.1.1版本在麒麟V10和欧拉2.9的操作系统上误报,可以屏蔽或者不管

5.png