大数据
-
GaussDB(DWS)单节点长时间故障应急
前言:单节点长时间故障造成对应主机与备机压力增大,容易造成集群只读,该场景下如何进行应急? 1、连接主机删除主备复制槽: 1)查看备机故障情况下主备复制槽active为f: select * from pg_get_replication_slot…
-
【集群创建失败】DWS.6000/46%左右失败/RdsDownloadPackageTask失败
现象: 1.DWS.6000 2.46%左右失败 分析 1.登录dwscontroller后台rms库查看发现 在task RdsDownloadPackageTask 失败 登录数据库: https://bbs.huaweicloud.com/forum/thread-173822-1-1.html select task.job_id,…
-
【集群管理】集群更多查看监控指标不显示内容
【问题版本】HCS 802 DWS 1230 【问题现象】 1.数据仓库服务--》集群管理--》集群查看多--》查看监控指标:监控指标空白不显示 【原因分析】 1.登录任意节点,查看日志:/home/Ruby/logs/ces/ces.log,日志中有 The…
-
Too many open files in system导致单节点故障,导致集群不可用
问题现象: db03节点故障导致集群不可用 通过Xshell连接工具直接连接故障服务器,无法正常登录和执行命令;通过BMC界面执行linux相关命令都会报错,Too many open files in system,这个错误表明句柄数超出系统限制…
-
【应急系列】【应急标准操作】【纯软】重启集群
1. 适用场景 当主机发生故障状态异常时,用户可能需要停止主机上的所有角色,对主机进行维护检查。故障清除后,启动主机上的所有角色恢复主机业务。 2. 前提条件 GaussDB A集群安装成功,且处于已启动状态。 …
-
某局点FIM页面有37031告警, CM_AGENT连接数据库失败
故障现象: 某局点FIM页面有37031告警, CM_AGENT连接数据库失败 查看集群状态一直是降级状态,备DN 6044一直处于starting状态 排查过程: 查看DN日志,可以看到有报no space left on device 这时去df -h,使用率不…
-
【创建集群失败】ResTenantTask报错
1. IAM user already exists 原因: 创建资源租户成功,但插入res_tenant表失败。 解决方案: 方法1 沟通IAM侧删除该资源租户,将res_tenant表中`vmPwdUpdateTi…
-
【8.0.3】创建DWS集群报错,资源租户VPC,后台查错误步骤为CreateResourceTenantVpc Failed
1. 管控面版本 : HCS 8.0.3 , 430版本。 2. 问题现象: 创建集群失败,后台查询错误步骤为创建资源租户VPC的TASK失败,如下图所示。定位中发现日志报创建subnet失败,提交的创建请求中,dns值为0.0.0.0。 3. 原因:…
-
集群信息报异常DWS.0005 访问资源不存在或状态异常
【问题现象】 集群管理-->集群名下钻-->集群信息报异常DWS.0005 访问资源不存在或状态异常 【分析过程】 发现在查询规格的接口报错,所以查看对应的表中是否有相应规格记录 -- 1.查询实例表 select specId,st…
-
【运维变更】【标准变更方案】【HC/HCS/HCSO】主备均衡
1. 适用场景 集群在运行过程中,出于运维目的数据库管理员可能需要手工对DN或GTM做主备切换。例如发现DN或GTM主备自动failover后想恢复原有的主备角色。 2. 前提条件 1) DWS集群安装成功,且处于主备不均衡状…