一、为什么要分库分表
数据库中的数据量是在不断增加的,在未进行分库分表的情况下,随着时间和业务的发展,库中的表会越来越多,表中的数据量也会越来越大,相应地,数据操作,增删改查的开销也会越来越大;另外,由于无法进行分布式部署,而一台服务器的资源(CPU、磁盘、内存、IO等)是有限的,最终数据库所能承载的数据量、数据处理能力都将遭遇瓶颈。
二、具体什么情况下可以开始考虑要分库分表
理论上说mysql单表数据达到5000W的时候性能才会下降,但是实际情况下有的可能数据到了300W就不行了,有的可能到了1000W-2000W性能还OK,所以我们要综合考虑硬件、业务、数据库参数、表结构设计等各方便考虑。另外,即使由于数据量的增加导致的性能下降,我们是建议先考虑索引优化,合理设置缓存,升级硬件,业务协调等手段,总之原则是能不分库分表就不分库分表。因为分库分表会带来很多烦恼。
三、分库分表带来的问题
1. 事务支持,扩库/扩表后事务就成分布式的了,问题难度显然上升了一个级别
2. 查询结果合并,这个看起来不难,但是把order by/limit/查询中不带分表字段等加上,要解决的问题还也不少
3. join,这个更难
4. 分库?分表?还是分库分表?这个需要考虑并做一个决定
5. 分完后能否合并?分容易,和很难
6.。。。
但是不管有多少问题,真正需要分库分表的时候还是要分库分表。
四、常见的分库分表方式
单库单表
多库单表
多库多表
五、mysql分库分表中间件
目前市面上中间件种类很多种 先看下各种中间件背景:
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/4782.html