1. 集群的角色描述:
角色 |
描述 |
领导者(leader) |
领导者负责进行公布决议,主要处理写请求 |
跟随者(follower) |
Follower用于接收客户端请求并向客户端返回结果(只能处理读请求,如果接收到写请求, 将写请求转发给leader),当leader宕机时,发起选主,有投票和被投票权 |
观察者(observer) |
Observer可以接收客户端连接,将写请求转发给leader节点,帮助follower减轻读的压力。 但Observer不参加选举和被选举。Observer的目录是为了扩展系统,提高读取速度 |
客户端 |
请求发起方 |
2. zookeeper的选主过程
(1)全新集群的选主:
根据启动的顺序和id进行选主(过半机制:集群中超过半数的集群可使用时,才开始选主)
以hadoop01(id=1)—hadoop02(id=2)—hadoop03(id=3)—-hadoop04(id=r)—-hadoop05(id=5)为例:
-
当hadoop01启动时,此时只有它一台服务器,,他发出取的报告没有任何相应,所有它的选举一直是looking状态。
-
Hadoop02启动:它与最开始启动的hadoop01进行通信,相互交换自己的选举结果,由于两者都没有历史数据,所以id值较大的服务器胜出,但是由于没有达到超过半数以上的服务器同意选举它(这个例子中的半数以上是 3),所有hadoop01、hadoop02还是继续保持looking状态。
-
Hadoop03启动,根据前面的分析,服务器 3 成为服务器 1,2,3 中的老大,而与上面不 同的是,此时有三台服务器(超过半数)选举了它,所Hadoop03它成为了这次选举的 leader
-
服hadoop04启动,根据上面的分析,理论上,hadoop04应该是服务器中id最大的,但是由前面已近有超过半数的服务器选举了hadoop03,所以hadoop04只能是follower
-
Hadoop05启动,与hadoop04一样,也是follower
zookeeper server的三种工作状态:
-
LOOKING:当前 Server 不知道 leader 是谁,正在搜寻,正在选举
-
LEADING:当前 Server 即为选举出来的 leader,负责协调事务
-
FOLLOWING:leader 已经选举出来,当前 Server 与之同步,服从 leader 的命令
(2)非全新集群的选主
leader 已经选举出来,当前 Server 与之同步,服从 leader 的命令,但是由于某种原因主节点宕机:
此时我们根据三个维度来选主:数据version、serverid、逻辑时钟。
-
数据version:数据新的version就大,数据每次更新,同时会更新它的version
-
Serverid:就是我们配置的 myid 中的值,每个机器一个
-
逻辑时钟:这个值从0开始,每一次选举对应一个值,也就是说,如果在同一次选举中,这个值应该一致,逻辑时钟越大,说明这一次选举leader人的进程更新,也就是每次选举拥有一个 zxid,投票结果只取 zxid 最新的
选举的标准:
-
逻辑时钟小的选举结果被忽略,重新投票
-
统一逻辑时钟后数据version大的胜出
-
逻辑时钟统一,version也相同,,server id 大的胜出。
根据以上的规则,快速选出集群的主节点。
3. zookeeper写数据的流程:
-
客户端发送写入数据的请求,这个请求最终会被leader处理
-
leader会先写入数据,写入完成之后通知follower进行数据的同步
-
follower就会开始进行数据的同步(并行,多台follower并行同步)
-
每一个follower只要数据同步完成就会向leader发送数据同步成功信息
-
leader接收到超过半数以上的成功信息后,则认为这次写数据成功
-
其他节点慢慢进行同步,在数据同步的过程中,不对外提供读写服务
4. zookeeper的数据的同步过程
-
follower连接leader并发送自己最大的zixd
-
leader进行对比,将自己最大的zxid和follower发送过来的zxid进行对比,如果leader的zxid大于follower的,则通知follower进行数据同步
-
follower发送数据同步请求
-
leader确定当前的follower的数据同步点(从follower最大的zxid到leader最大的zxid之间数据需要同步)
-
follower开始同步数据,这个过程不对外提供读写服务。
-
follower同步完成,发送消息给leader
-
leader就会修改当前的follower的状态为update,这个时候follower就可以接受客户端的读写请求,但是只能读,如果是写入请求,需要转发给leader
5. ZooKeeper 中各个角色的工作职责
(1)Leader
-
恢复数据
-
维持与follower的心跳,接收follower请求并判断follower的请求消息类型
-
根据不同的消息类型,进行不同的处理
(2)follower
-
向leader发送请求(同步数据,写入请求)
-
接收leader的消息并进行相应的处理
-
接收client的读写请求,如果是写入的请求转发给leader处理
-
返回client的读请求,查询的结果
原创文章,作者:carmelaweatherly,如若转载,请注明出处:https://blog.ytso.com/193820.html