一、介绍
1.1、概述
Zookeeper 是一款开源的分布式的,为分布式框架提供协调服务的 Apache 项目。
Zookeeper 工作机制:
Zookeeper 从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper 就将负责通知已经在 Zookeeper 上注册的那些观察者做出相应的反应。
1.2、特点
- Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
- 集群中只要有半数以上节点存活,Zookeeper 集群就能正常服务。所以 Zookeeper 适合安装奇数台服务器。
- 全局数据一致:每个 Server 保存一份相同的数据副本,Client无论连接到哪个 Server,数据都是一致的。
- 更新请求顺序执行,来自同一个 Client 的更新请求按其发送顺序依次执行。
- 数据更新原子性,一次数据更新要么成功,要么失败。
- 实时性,在一定时间范围内,Client 能读到最新数据。
1.3、数据结构
ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树,每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以通过其路径唯一标识。
1.4、应用场景
提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。
1.4.1、统一命名服务
在分布式环境下,经常需要对应用服务进行统一命名,便于识别。
例如: IP不容易记住,而域名容易记住。
1.4.2、统一配置管理
- 分布式环境下,配置文件同步非常常见。
- 一般要求一个集群中,所有节点的配置信息是一致的, 比如 Kafka 集群。
- 对配置文件修改后,希望能够快速同步到各个节点上。
- 配置管理可交由 ZooKeeper 实现。
- 可将配置信息写入ZooKeeper 上的一个 Znode。
- 各个客户端服务器监听这个 Znode。
- 一旦 Znode 中的数据被修改, ZooKeeper 将通知各个客户端服务器。
1.4.3、统一集群管理
- 分布式环境中,实时掌握每个节点的状态是必要的。
- 可根据节点实时状态做出一些调整。
- ZooKeeper 可以实现实时监控节点状态变化。
- 可将节点信息写入 ZooKeeper 上的一个 ZNode。
- 监听这个 ZNode 可获取它的实时状态变化。
1.4.4、服务器节点动态上下线
客户端能实时洞察到服务器上下线的变化
1.4.5、软负载均衡
在 Zookeeper 中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。
二、安装
2.1、下载
$ wget https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.tar.gz
2.2、Zookeeper 本地安装
2.2.1、安装 JDK
2.2.2、解压
$ tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C .
$ mv apache-zookeeper-3.5.7-bin zookeeper-3.5.7
2.2.3、修改配置
# 增加 zkData 目录
$ mdkir zkData
$ cd zookeeper-3.5.7/conf
$ mv zoo_sample.cfg zoo.cfg
$ vim zoo.cfg
# 修改数据保存目录
dataDir=zookeeper-3.5.7/zkData
2.3、操作 Zookeeper
2.3.1、启动 Zookeeper
$ bin/zkServer.sh start
2.3.2、查看进程是否启动
$ jps
8413 QuorumPeerMain
8431 Jps
2.3.3、查看状态
$ bin/zkServer.sh status ZooKeeper JMX enabled by default Using config: /Users/hudu/Environment/zookeeper/zookeeper-3.5.7/bin/../conf/zoo.cfg Client port found: 2181. Client address: localhost. Mode: standalone
2.3.4、启动客户端
$ bin/zkCli.sh
# 退出
quit
2.3.5、停止 Zookeeper
$ bin/zkServer.sh stop
三、配置参数说明
Zookeeper 中的配置文件 zoo.cfg 中参数如下
# 通信心跳时间,Zookeeper 服务器与客户端心跳时间,单位毫秒
tickTime=2000
# LF 初始通信时限
# Leader 和 Follower 初始连接时能容忍的最多心跳数(tickTime 的数量)
initLimit=10
# LF 同步通信时限
# Leader 和 Follower 之间通信时间如果超过 syncLimit * tickTime,Leader 认为 Follower 宕机,从服务列表中删除 Follower
syncLimit=5
# 保存 Zookeeper 中的数据
dataDir=/Users/hudu/Environment/zookeeper/zookeeper-3.5.7/zkData
# 客户端连接端口,通常不做修改
clientPort=2181