RAC重构类型是怎么样的

本篇文章为大家展示了RAC重构类型是怎么样的,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

RAC隔离体系可分为3层:DB层,clusterware层和OS层
每一层都提供了机制用于保证RAC正常工作,每一层也都可引发RAC重构;

DB层
由LMON进程维护,其提供了CGS和NM两个服务,CGS位于NM之上
NM:每个instance的所有进程被看作一个组注册到clusterware,其中LMON为主进程;其为DB和clusterware的通信通道,同时负责和其他节点NM定期通信;
Instance正常启动或关闭时,其NM向clusterware进行注册或取消注册,同时通知其他节点的NM,然后由NM通知CGS负责重构;
Startup/shutdown normal –〉 local NM–〉 remote NM –〉 remote CGS –〉GCS/GES reconfiguration

如果instance异常关闭或LMON/LMS/LMD通信超时,则需要由CGS进行IMR,将重构的结果记录到控制文件的CFVRR字段(control file vote result record),由各instance读取该字段以获悉自己是否被驱逐

Shutdown abort/ipc timeout –〉 IMR –〉 control file

由上所述,DB层由于timeout引发重构可分为两种:

LMON通信超时:默认300秒,因LMON/LMS/LMD通信异常导致

NAME                                               VALUE                     ISDEFAULT ISMOD      ISADJ

————————————————– ————————- ——— ———- —–

_cgs_send_timeout                                  300                       TRUE      FALSE      FALSE

控制文件超时:默认900秒,ckpt每3秒更新一次控制文件,如果超过规定时间仍无相应则会触发IMR

NAME                                               VALUE                     ISDEFAULT ISMOD      ISADJ

————————————————– ————————- ——— ———- —–

_controlfile_enqueue_timeout                       900                       TRUE      FALSE      FALSE

另据What is Split Brain in Oracle Clusterware and Real Application Cluster [ID 1425586.1]记载

Controlfile is used similarly to voting disk in clusterware layer to determine which instances survive and which instances evict. The voting result is similar to clusterware voting result

控制文件在RAC层充当voting disk的角色

Clusterware层

由OCSSD负责,其提供两种心跳机制,分别为network heartbeat和disk heartbeat,其参数值分别如下

[oracle@ ~]$  crsctl get css disktimeout

CRS-4678: Successful get disktimeout 200 for Cluster Synchronization Services.

[oracle@ ~]$ crsctl get css misscount

CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.

网络心跳超时会导致集群被分隔成n个子集群,拥有节点数最多的子集群最终获取控制权,其余节点会被剔出重启(11R2引入新机制取代了fast reboot);
The group with lower node member in case of same number of node(s) available in each group
如果两个子集群节点数一样多,用于较低节点号的子集群会最终存活

磁盘心跳超时:如果ocssd没有在规定时间内更新voting disk则oracle认定其offline,如果offline数量大于online数量该节点则会被驱逐;

OS层

Hangcheck-Timer:用于检测linux是否hang
Oprocd:10204起linux引入此进程,每1秒执行一次检查,如果失败则sleep 500毫秒后继续尝试;11R2起被cssdagent替代;

上述内容就是RAC重构类型是怎么样的,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/208038.html

(0)
上一篇 2021年12月6日
下一篇 2021年12月6日

相关推荐

发表回复

登录后才能评论