技术专区
-
【安装】DWS集群创建,BMS规格不显示
【问题现象】 在HCS环境中DWS服务安装完成后在创建集群页面不显示DWS规格信息,导致无法创建DWS集群。 【分析过程】参考已有案例:https://bbs.huaweicloud.com/forum/thread-93562-1-1.html1.登录cdk检查页面,在d…
-
【故障】oms组件iam状态exception,manager无法登录
一、故障现象 manager无法登录,查看oms状态,iam组件为exception状态;操作系统为麒麟v10或欧拉2.9;数据库版本为8.1.1 二、问题原因 1.iam组件启动,需要连接oms节点的数据库 2.查看/var/log/Bigdata/omm/oms/db/…
-
GaussDB(DWS)重建实例
1. 适用场景 硬件故障进行过单盘替换、背板替换、内存故障等。 较为严重数据倾斜,清除倾斜表后对备机进行重建以便快速恢复。 2. 前提条件 GaussDB A集群安装成功,且处于已启动状态。 集群处于Degraded或nor…
-
GaussDB(DWS)主备切换分析
集群运行过程当中发现有: FI监控页面有主备断连或者不同步告警: 编号 日志内容 1 Datanode主备不通过或者断连,重要,xxxx ps -ef 查看某一节点上gaussdb进程运行时间与其他实例不同 查看集群状态不均衡需要分析主…
-
主机故障导致MPPDB集群降级
一.本案例适合什么场景? 网卡光口不通导致服务器宕机 二.问题分析 1.修复硬件,启动服务器 2.硬件修复的节点,dn被拉起后,开始catchup 3.等待catchup完成后,进行主备均衡 4.主备均衡参考标准方案 https://bbs.hu…
-
新搭建集群,导入lisence文件失败
一.本案例适合什么场景? 集群交付过程中,license导入失败; 二.问题分析 1.FI Manager版本为6.5.1.7,MPPDB版本为8.1.0,未适配,非标交付导致
-
DN长时间处于starting状态--(文件系统问题)
现象:某局点FIM上反复报37031 CM_AGENT连接数据库失败,查看集群状态降级,仅一个备DN6044一直在starting 可以看到pg_log日志里有报no space left on device 去看查看磁盘使用率df -h使用率不到50%,df -i查看inod…
-
GaussDB(DWS)单节点长时间故障应急
前言:单节点长时间故障造成对应主机与备机压力增大,容易造成集群只读,该场景下如何进行应急? 1、连接主机删除主备复制槽: 1)查看备机故障情况下主备复制槽active为f: select * from pg_get_replication_slot…
-
【集群创建失败】DWS.6000/46%左右失败/RdsDownloadPackageTask失败
现象: 1.DWS.6000 2.46%左右失败 分析 1.登录dwscontroller后台rms库查看发现 在task RdsDownloadPackageTask 失败 登录数据库: https://bbs.huaweicloud.com/forum/thread-173822-1-1.html select task.job_id,…
-
【集群管理】集群更多查看监控指标不显示内容
【问题版本】HCS 802 DWS 1230 【问题现象】 1.数据仓库服务--》集群管理--》集群查看多--》查看监控指标:监控指标空白不显示 【原因分析】 1.登录任意节点,查看日志:/home/Ruby/logs/ces/ces.log,日志中有 The…