【故障】【表空间】绝对表空间使用不规范致使内存异常

文章目录[隐藏]

1. 问题描述

版本：GaussDB A-8.0.0.1

1月18日下午3时，客户反馈执行业务脚本报错：-bash: fork: Cannot allocate memory，执行基本的OS命令均不能成功。

备机修复的时候会去主实例同步数据，主实例扫描节点下数据，由于使用绝对表空间且其路径定为/srv/BigData/mppdb/data1,主实例会去目录扫描，造成死循环，因此消耗大量内存导致节点被kill。

方案中所有图片均为家里复现收集，实际以现场环境为主！

登录数据库后使用\db查询表空间，可以看到wd使用了绝对路径，此路径造成备机build的死循环；
找到所有CN所在路径：cm_ctl query –Cvd| grep coo，截图保留；
停集群，cm_ctl stop -mi；
进入物理机1上的/srv/BigData/mppdb/data1目录；
mkdir创建一个文件夹，并将所有PG目录拷贝到新建的目录中；
其他物理机重复此操作；
回到物理机1上，进入/srv/BigData/mppdb/data1目录后，进入到master下的pg_tblspc目录，将软连接更新为刚创建的目录的绝对路径；
进入到/srv/BigData/mppdb/data1下的slave目录，再进入至pg_tblspc目录，同样更新软连接；
进入到/srv/BigData/mppdb/data2下的master目录，重复7~8步，直至物理机上所有的master、slave均更新了表空间软连接；
再到物理机2上重复7~9，直至所有机器完成；
登录到相应机器上的CN目录（步骤2），在pg_tblspc下同样更新软连接；（每台机器都要做）
启动集群：cm_ctl start；
登录数据库查看表空间绝对路径是否发生变化；
查看此时集群状态以及内存情况，无占用内存过高的session且集群状态变为normal则恢复；

原创文章，作者：奋斗，如若转载，请注明出处：https://blog.ytso.com/tech/bigdata/316502.html