问题描述
某局点在由c70升级到c80版本的过程中,在执行./upgrade.sh升级manager步骤时报错
告警信息


处理过程
查看报错节点/var/log/Bigdata/mpp/upgrade/目录下的upgrade日志 发现是在安装node agent步骤的时候从主oms节点scp文件到报错节点失败:

怀疑互信有问题,于是使用omm用户从报错节点ssh到主oms节点,发现需要输入密码,则问题根因为该节点到oms节点互信发生了故障:

解决方案
1.使用omm用户登录互信故障节点,执行 sh $BIGDATA_HOME/om-agent/nodeagent/bin/update-ssh-key.sh生成新的ssh秘钥对
2. 将新生成的/home/omm/.ssh/id_rsa.pub公钥文件copy至主oms节点,将该文件追加到主oms节点的/home/omm/.ssh/authorized_keys文件中
3. 将主oms节点的/home/omm/.ssh/authorized_keys文件copy到集群中每个节点的/home/omm/.ssh目录下
4.重启ssh-agent服务
ps -ef|grep ssh-agent
kill掉ssh-agent相关进程,包括ssh-agent、ssh-agent-monitor.sh
5.重启sshd服务
service sshd restart
6. 从故障节点ssh其他节点验证修复结果,互信通过,无需输入密码。
然后重新执行升级失败的步骤,通过。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316252.html