GaussDB 200数据库架构介绍

GaussDB 200是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供PB(Petabyte)级数据分析能力、多模分析能力和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载(HTAP)等场景,广泛应用于金融、政府、电信等行业核心系统。

GaussDB 200采用MPP(Massively Parallel Processing)架构,在核心技术上跟传统数据库相比有巨大优势,可以解决很多行业用户的数据处理性能问题,可以为超大规模数据管理提供高性价比的通用计算平台,并可用于支撑各类数据仓库系统、BI(Business Intelligence)系统和决策支持系统,统一为上层应用的决策分析等提供服务。

GaussDB 200采用Share-nothing架构,由多个拥有独立且互不共享CPU、内存、存储等系统资源的节点组成。在这样的系统架构中,业务数据被分散存储在多个物理节点上,数据分析任务被推送到数据所在位置就近执行,通过控制模块的协调,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。

Share-nothing又称为无共享架构,Share-nothing架构具备易于扩展、内部自动并行处理,无需人工分区或优化,提供最优化的I/O处理性能,增加节点可实现存储、查询及加载性能的线性扩展的优点,和其他架构的对比如图一所示。

GaussDB 200数据库架构介绍
 图一 架构对比图

GaussDB 200由多个MPPDBServer组成,GaussDB 200逻辑架构如图二所示。

GaussDB 200数据库架构介绍
图二 GaussDB 200逻辑架构图

CM(Cluster Manager):即含CMServer进程的特殊MPPDBServer,负责管理和监控分布式系统中各个功能单元和物理资源的运行情况,确保整个系统的稳定运行,分为主CM和备CM。

MPPDBServer(GTM):全局事务管理模块GTM,虽然是分布式数据库,同样具备关系型数据原本的ACID特性,可灵活实现表级锁和行级锁控制功能。
业务模块:即除MPPDBServer(CM)、MPPDBServer(GTM)以外的MPPDBServer,由Coordinator及多个Datanode组成。
 Coordinator(CN):负责提供外部应用接口、优化全局执行计划、向Datanode分发执行计划,以及汇总、处理执行结果。

Datanode(DN):在集群中,DN有多个,每个DN存储了一部分数据。如果DN无高可用方案,则故障时会导致该实例上的数据无法访问。因此GaussDB 200对DN提供了高可用方案:主、备、从备。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/315786.html

(0)
上一篇 2025年3月30日 14:00
下一篇 2025年4月9日 11:49

相关推荐

发表回复

登录后才能评论