如何处理GaussDB 200FIM互信问题造成的升级失败

问题描述

某局点在由c70升级到c80版本的过程中,在执行./upgrade.sh升级manager步骤时报错

 

告警信息

89bee4b995a04cd7a2d9ea715a5924eb

10983d646d05412fa3427a84a6a8593d

 

处理过程

查看报错节点/var/log/Bigdata/mpp/upgrade/目录下的upgrade日志 发现是在安装node agent步骤的时候从主oms节点scp文件到报错节点失败:

38b913e8544e4f23bd4ddabafd9b0ed2

怀疑互信有问题,于是使用omm用户从报错节点ssh到主oms节点,发现需要输入密码,则问题根因为该节点到oms节点互信发生了故障:

d4051470e4724207befc480fa80cf55c

解决方案

1.使用omm用户登录互信故障节点,执行 sh $BIGDATA_HOME/om-agent/nodeagent/bin/update-ssh-key.sh生成新的ssh秘钥对

2. 将新生成的/home/omm/.ssh/id_rsa.pub公钥文件copy至主oms节点,将该文件追加到主oms节点的/home/omm/.ssh/authorized_keys文件中

3. 将主oms节点的/home/omm/.ssh/authorized_keys文件copy到集群中每个节点的/home/omm/.ssh目录下

4.重启ssh-agent服务

ps -ef|grep ssh-agent

kill掉ssh-agent相关进程,包括ssh-agent、ssh-agent-monitor.sh

5.重启sshd服务

service sshd restart

6. 从故障节点ssh其他节点验证修复结果,互信通过,无需输入密码。

然后重新执行升级失败的步骤,通过。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316252.html

(0)
上一篇 2025年10月28日 14:22
下一篇 2025年10月28日 14:29

相关推荐

发表回复

登录后才能评论