大数据
-
内存不可用报错:memory temporarily unavailable 的排查方法
1.当出现memory temporarily unavailable报错时,首先根据报错信息确认具体是哪个cn/dn报的,如果报错信息前面没有类型dnxxxx_xxxx这样的信息,就是cn报的,需要去每个cn的日志里排查是哪个cn 2.通过free -g或top查…
-
很久不用集群,查询集群状态,都是Ticket expired,Unspecified GSSfailure等等
集群很久不用或者不关注,告警不处理,很容易出现问题。当后台用户密码超期时,查询集群状态,cm_ctl query -Cv 就会变成如下这样的状态。 【定位原因】 尝试去使用后台用户omm用户登录到集群后台节点,或者去ssh到…
-
【内存】没有analyze时可能会导致内存不可用报错:memory is temporarily unavailable
DWS的内存保护机制会在我们使用的内存达到参数设置的上限的时候产生报错提示:memory is temporarily unavailable,这是为了避免我们执行作业的时候,使用的内存过多时可能会造成操作系统级别的OOM,导致数据库进…
-
terminating connection due to administrator command
业务报错:terminating connection due to administrator command原因总结如下 session_timeout 查看报错的CN日志,如果有session unused timeout这样的日志,说明是会话超时导致的。 解决办法: a) 连接CN查看超时…
-
TCP临时端口使用率超过阈值告警
1. 问题描述 版本:GaussDB 6.5.1.9 客户跑批业务时,CN所在服务器经常出现TCP端口使用阈值告警,总共配置端口数量为32000+,会使用26000+,占比82%。 2. 数据收集: 查看系统随机端口资源:cat /proc/sys/net/ip…
-
pgxc_node的hostis_primary的值和实际对不上怎么解决
pgxc_node这个系统表,在每个cn都有自己的一个表,用来帮助cm去仲裁整个集群的状态,其中,每一组dn实例会在其中有一行数据,如下图: dn_6001_6002在这个表里是一行,其中hostis_primary这个字段,标识这当前6001…
-
GDS启动失败
问题现象】 6.5.1 客户来电反馈充当GDS的服务器异常,当前更换为新服务器进行GDS连接,配置好后在启动GDS时报错。 【问题影响】 【客户态度】 【处理过程】 报错如下: 执行ldd /opt/bin/gds/gds发现libcjson.so.1…
-
【GaussDB A 8.0】【集群通信】应急处理客户端连接报错too many clients already
1. 集群版本 GaussDB A 8.0及6.5.1版本 2. 影响范围 应急处理后立即恢复 3. 问题描述 客户端连接数据库、查询语句等,报错连接已满:too many clients already, active/non_active: xxxx/xxxx. 4. 数据收集 报错…
-
GaussDB(DWS)添加主机在初始化服务和实例失败,还原元数据报错缺少format option
发生版本 【GaussDB(DWS)】【C80SPC300】 问题描述 导入元数据阶段报错error:dn_7029_7030:Need format option for the foreign table: 问题分析 重试并取出对应的sql文件,检查确认此外表确实缺少format option…
-
GaussDB(DWS)添加主机成功后页面出现37014 Gaussdb进程锁文件已经存在的告警
发生版本 【GaussDB(DWS)】【6.5.1】 问题描述 添加主机成功后页面出现37014 gaussdb进程锁文件已经存在的告警 问题分析 cma的启停线程在start_datanode_check逻辑,判断进程不存在之后,会检查是否有gs_ctl在运行…