GaussDB(DWS)集群监控未上报周期数值超过阈值告警

问题描述

在hcs告警中出现集群监控未上报周期数值超过阈值告警

处理过程

1.在dms-collection容器查看dms-collection.log,是否有相关表的入库的主键冲突

 

GaussDB(DWS)集群监控未上报周期数值超过阈值告警

2.再到dms库确认是否在dms_mtc_max_ctime表中有上述信息多条记录

select * from dms_mtc_max_ctime where table_name = ‘DMS_MTC_DB_SESSIONS’
select * from dms_mtc_max_ctime where table_name = ‘DMS_MTC_CLUSTER_INST_STAT’

GaussDB(DWS)集群监控未上报周期数值超过阈值告警

3.删除这些记录信息

delete from dms_mtc_max_ctime where table_name = ‘DMS_MTC_DB_SESSIONS’
sdelete from dms_mtc_max_ctime where table_name = ‘DMS_MTC_CLUSTER_INST_STAT’

等待自动更新后,告警清除后不再出现

根因

由于版本升级在hcs821的版本中,相关监控信息有所有cn采集变为ccn,但是dms库更新是有主键冲突,导致报错,从而在hcs告警中出现集群监控未上报周期数值超过阈值告警

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316348.html

(0)
上一篇 2025年10月29日 00:29
下一篇 2025年10月29日 00:31

相关推荐

发表回复

登录后才能评论