技术专区

  • 升级集群42%报错,更新系统表cannot change return type of existing functio

    一.本案例适合什么场景? 升级集群42%报错,更新系统表cannot change return type of existing function 二.问题分析 1. 查看$GAUSSLOG/om/gs_upgradectl*.log日志,mpp16节点,更新系统表失败 2.登录报错的节点,…

    2025年10月29日
  • DWS8.0.1线下集群安装preinstall卡住

    某局点安装环境是出现了presintall安装卡住。 4节点最小合布安装,其中查看fi-preinstall.log可以看到日志最后只记录186节点启动sshd成功 查看186和183都是卡住的,我们可以查看preinstall进程,发现其实在进行setu…

    2025年10月29日
  • 日志路径权限不足导致的增加CN失败。

    该问题发生于增加CN时报错,定位步骤如下:  分析日志。进入$GAUSSLOG/om下,搜索包含错误码GAUSS_5字段的日志上下文。 如报错内容包含permission denied字段,则通过日志确认准确的权限不足路径。 进入该路径,搜…

    大数据 2025年10月29日
  • pg_log日志过少

    该问题表现为日志记录过少,只能保存大约数个小时的日志记录,从而间接影响了问题发生时的定位能力。 问题定位步骤如下: 1. FIM管控面负责管理除了审计日志以外的日志。当大于10G时会开始清理日志。但是它的计算方…

    大数据 2025年10月29日
  • 环境变量污染导致的集群安装初使化失败。

    集群安装初始化失败,定位步骤如下:  分析日志。进入$GAUSSLOG/om下,搜索包含错误码GAUSS_5字段的日志上下文。 如发现无法获取到环境变量GPHOME导致的报错,则基本可以确定为安装环境存在环境变量污染。 查找/etc…

    大数据 2025年10月29日
  • 扩容或重装主机时报Failed to verify nodes connection错误

    操作场景 扩容主机失败,有如下提示信息: #发现节点未完成# Could not verify `ecdsa-sha2-nistp256` host key with fingerprint `31:90:be:5c:92:a4:62:90:7d:9a:d2:c2:4e:4f:d6:2a` for `xxx.xxx.xxx.xxx` on po…

    大数据 2025年10月29日
  • 【异常sql】找到占用CPU过高的sql语句

    问题描述 gaussdb进程持续占CPU过高,需找到占用CPU过高的sql语句 问题处理 找一个gaussdb进程,确认进程号和对应dn的端口号(进程号32089) 执行ps H -eo pid,tid,pcpu | sort -n -k 3 | grep 32089,可以查到进程…

    大数据 2025年10月29日
  • 【集群启停】dn手动停止之后再次启动时启动不了

    【问题现象】 现场出于某种原因主动停止了一个主dn,然后一段时间后重新去启动此dn,但是启动不起来,ps查进程也没看到相应进程启动。 【排查过程】 排查对应节点上systemcall日志,发现有如下报错,怀疑数据目录权…

    2025年10月29日
  • 配置的ntp外部时钟源可以ping通,但是ntp服务不能同步时间

    问题背景与现象 配置的ntp外部时钟源可以ping通,但是ntp服务不能同步时间,FusionInsight Manager 上报12012NTP 服务异常告警,告警附加信息提示: Detail=Status of upper ntp server is [.INIT.]. Upper ntp ser…

    大数据 2025年10月29日
  • 多租户资源管理,配置了CPU限额,还是出现了单个用户的作业将CPU资源占高的情况

    数据库使用过程中,有时会出现这样的情况,在OS文件系统有问题的情况下,配置了CPU限额,还是出现了单个用户的作业将资源占满的情况,具体根因是由于OS文件系统有问题的时候,会导致后台cgroup的挂载出现不稳定,从…

    大数据 2025年10月29日