技术专区
-
GaussDB(DWS)主备切换分析
集群运行过程当中发现有: FI监控页面有主备断连或者不同步告警: 编号 日志内容 1 Datanode主备不通过或者断连,重要,xxxx ps -ef 查看某一节点上gaussdb…
-
主机故障导致MPPDB集群降级
一.本案例适合什么场景? 网卡光口不通导致服务器宕机 二.问题分析 1.修复硬件,启动服务器 2.硬件修复的节点,dn被拉起后,开始catchup 3.等待catchup完成后,进…
-
新搭建集群,导入lisence文件失败
一.本案例适合什么场景? 集群交付过程中,license导入失败; 二.问题分析 1.FI Manager版本为6.5.1.7,MPPDB版本为8.1.0,未适配,非标交付导致
-
DN长时间处于starting状态–(文件系统问题)
现象:某局点FIM上反复报37031 CM_AGENT连接数据库失败,查看集群状态降级,仅一个备DN6044一直在starting 可以看到pg_log日志里有报no space …
-
GaussDB(DWS)单节点长时间故障应急
前言:单节点长时间故障造成对应主机与备机压力增大,容易造成集群只读,该场景下如何进行应急? 1、连接主机删除主备复制槽: 1)查看备机故障情况下主备复制槽active为f: sel…
-
【集群创建失败】DWS.6000/46%左右失败/RdsDownloadPackageTask失败
现象: 1.DWS.6000 2.46%左右失败 分析 1.登录dwscontroller后台rms库查看发现 在task RdsDownloadPackageTask 失败 登…
-
【集群管理】集群更多查看监控指标不显示内容
【问题版本】HCS 802 DWS 1230 【问题现象】 1.数据仓库服务–》集群管理–》集群查看多–》查看监控指标:监控指标空白不显示 【原…
-
Too many open files in system导致单节点故障,导致集群不可用
问题现象: db03节点故障导致集群不可用 通过Xshell连接工具直接连接故障服务器,无法正常登录和执行命令;通过BMC界面执行linux相关命令都会报错,Too many op…
-
【应急系列】【应急标准操作】【纯软】重启集群
1. 适用场景 当主机发生故障状态异常时,用户可能需要停止主机上的所有角色,对主机进行维护检查。故障清除后,启动主机上的所有角色恢复主机业务。 2. 前提条件 Gaus…
-
某局点FIM页面有37031告警, CM_AGENT连接数据库失败
故障现象: 某局点FIM页面有37031告警, CM_AGENT连接数据库失败 查看集群状态一直是降级状态,备DN 6044一直处于starting状态 排查过程: 查看DN日志,…