技术专区
-
【集群恢复】Gauss DB某一节点文件描述符耗尽应急
节点文件描述符耗尽可能引起GaussDB实例重启造成集群不可用,本文主要讨论如何快速恢复集群以及后续如何预防。 以下图为例,文件由于文件描述符耗尽导致实例异常状态如下: 前提:如何…
-
【6.5.1】【CM】集群重启后,备cm_server 进程down,cms无法启动
集群版本】GaussDB A 6.5.1 【问题描述】集群重启后,备cm_server 进程down,cms无法启动 【机制说明】 cm_server进程的启动是由cm_agent…
-
业务报错Cannot get stream index,maybe comm_max_stream is not
【问题描述】业务报错Cannot get stream index,maybe comm_max_stream is not enough 【机制说明】 comm_max_stre…
-
用DS连接,等待锁超时,wait transaction 1234567 sync time exceed 600
日常使用过程中出现业务报错:ERROR: wait transaction 1257273 sync time exceed 600s. 就是这种等待某个事物超时的情况。这样的问题…
-
【内存】idle线程过多导致memory is temporarily unavailable
问题现象: 集群出现很多dn报内存不可用问题,导致大批作业中断。 ERROR: dn_6217_6218 memory is temporarily unavailable DET…
-
【内存】表定义不合理导致autovacuum占用大量内存
问题现象: 1.查看数据库日志,每十分钟就会报一次内存耗尽,报错时间点与跑不出来作业的时间点一致 2. 查看pgxc_total_memory_detail中各个cn和dn历史最高…
-
CPU高的高效排查手段
1.top看哪个进程高,记pid2.top -H -p pid 查看这个进程里具体什么线程占用cpu3.gstack pid(线程id),可以看下这个语句的执行过程,是在干些什么事…
-
界面实例启动失败,后台集群状态正常
整个数据库集群中,会分为管控面的界面,和实际业务执行的后台集群。 有时会有这样的情况,在一系列变更等操作之后,可能去做一个启动或者重启等操作,这时候发现界面启动就失败了。但是查后台…
-
使用omm用户修改集群参数时报“Permission denied”
问题描述:使用omm用户修改数据库内存参数时 gs_guc set -N all -I all -Z datanode -c “shared_buffers=2GB&#…
-
集群出现大量(5W+)僵尸进程,OS load高,引发os重启
【问题现象】 操作系统版本:Redhat 7.4 / x86 GaussDB版本:GaussDB A 6.5.1.5 集群出现大量(5W+)僵尸进程,OS load高,引发os重启…