架构师成长之路之数据库选型指南

一、前言
架构师在工作中经常会遇到数据库存储选型的问题,而市面上数据库产品众多,往往会无从下手,甚至有时候从业务开发到上线运维过程中会多次更换底层数据库,给整个研发中心带来不必要的额外工作。

结合业务场景做数据库存储选型的时候,可以综合以下几个维度去考虑:

二、选型维度
1、业务是否需要保证ACID事务?

事务具有4个特征,分别是原子性、一致性、隔离性和持久性。

YES:主流的关系型数据库:MySQL、pg(PostgreSQL)等

NO:主流NOSQL如:MongoDB、hbase、cassandra等

2、要求低延迟?

对性能要求极致,不担心数据丢失的选择:memcache

数据生命周期短,数据量相对小,性能要求高,需要存储灵活的数据结构:Redis

一般scylladb>canssdra>hbase

3、是否高并发写入,随机读多于范围读?

YES: hbase、cassandra,hbase范围读更优。

4、海量数据存储,支持水平扩展,分布式容错?

YES:分布式 NOSQL 如:resis、hbase、Cassandra、mongodb

5、需要全文搜索?

YES:海量数据用Elasticsearch;数据量可控用pg GIST索引。

6、存储复杂数据模型?

YES:文档数据库mongodb

7、OLTP OR OLAP OR离线分析?

OLTP(联机事务处理):行存数据库 mysql 、pg

OLAP(联机分析处理):列存数据库高压缩 gp 、clickhouse

离线分析:hbase

8、金融级要求高可用、数据不丢

oceanbase、阿里云mysql金融版、mysql group replication

9、需要事务而且海量数据存储

分库分表:drds、sharding-jdbc+关系型数据库

newsql:TiDB

10、CAP权衡

CAP: 一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)。

CA :关系型数据库

CP :hbase、redis、mongodb

AP :cassandra、riak 、couchdb

11、特殊业务场景

地理信息系统GIS:PG>ES>Mongodb

时序:TaosDB>influxdb>opentsdb

12、开发角度,业务迭代快,需要schema free

对开发友好:关系型数据库都行。另外就是MongoDB,不过也有两面性,不如关系型数据库有严格的约束,将任意类型的任意值插入任意集合,有时候会带来负面作用。

13、运维角度

易运维 cassandra>hbase

 

三、相关资料:
阿里云开发者社区—数据库选型: https://developer.aliyun.com/ask/268162?utm_content=g_1000096922

ClickHouse是什么: https://blog.csdn.net/likun557/article/details/109733541

MongoDB、ElasticSearch、Redis、HBase这四种热门数据库的优缺点及应用场景: https://zhuanlan.zhihu.com/p/37964096

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/notes/178851.html

(0)
上一篇 2021年10月27日 11:06
下一篇 2021年10月27日 11:47

发表回复

登录后才能评论