使用Kazoo操作ZooKeeper服务治理

单机服务的可靠性及可扩展性有限,某台服务宕机可能会影响整个系统的正常使用;分布式服务能够有效地解决这一问题,但同时分布式服务也会带来一些新的问题,如:服务发现(新增或者删除了服务如何确保能让客户端知道),容灾(某些服务出现故障如何让客户端只访问正常的服务);ZooKeeper的提出主要是为了解决分布式服务的治理问题,它在分布式环境中协调和管理服务。

Zookeeper协调管理服务的过程如下图:

使用Kazoo操作ZooKeeper服务治理

服务端:每台服务器都要向注册中心Zookeeper进行注册登记,并且保持与Zookeeper的连接,如果服务器与Zookeeper断开了连接,Zookeeper将删除该服务器的地址。
客户端:需要服务的时候先向Zookeeper订阅服务器的地址信息,Zookeeper返回给客户端已注册的服务器信息列表,客户端从服务器信息列表中选择服务器进行服务调用,如果Zookeeper记录的服务器信息发生了变更,服务器会通知客户端变更事件,客户端可以获取最新的服务器信息。
ZooKeeper文件系统的数据结构是个树状结构,它的每个节点(znode)由一个名称标识,并用路径/分割:

使用Kazoo操作ZooKeeper服务治理

ZooKeeper的节点类型有:

1. 持久节点(ZooKeeper默认的节点类型,创建该节点的客户端断开连接后,持久节点仍然存在)

2. 顺序节点(将10位的序列号附加到原始名称来设置节点的路径,如:/server0000000001)

3. 临时节点(当客户端与ZooKeeper断开连接时,临时节点会自动删除)

RPC服务注册到ZooKeeper

服务端:

 import threading
import json
import socket
import sys
from kazoo.client import KazooClient
from divide_rpc import ServerStub
from divide_rpc import InvalidOperation class ThreadServer(object):
def __init__(self, host, port, handlers):
self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
self.sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
self.host = host
self.port = port
self.sock.bind((host, port))
self.handlers = handlers def serve(self):
"""
开始服务
"""
self.sock.listen(128)
self.register_zk()
print("开始监听")
while True:
conn, addr = self.sock.accept()
print("建立链接%s" % str(addr))
t = threading.Thread(target=self.handle, args=(conn,))
t.start() def handle(self, client):
stub = ServerStub(client, self.handlers)
try:
while True:
stub.process()
except EOFError:
print("客户端关闭连接") client.close() def register_zk(self):
"""
注册到zookeeper
"""
self.zk = KazooClient(hosts='127.0.0.1:2181')
self.zk.start()
self.zk.ensure_path('/rpc') # 创建根节点
value = json.dumps({'host': self.host, 'port': self.port})
# 创建服务子节点
self.zk.create('/rpc/server', value.encode(), ephemeral=True, sequence=True) class Handlers:
@staticmethod
def divide(num1, num2=1):
"""
除法
:param num1:
:param num2:
:return:
"""
if num2 == 0:
raise InvalidOperation()
val = num1 / num2
return val if __name__ == '__main__':
if len(sys.argv) < 3:
print("usage:python server.py [host] [port]")
exit(1)
host = sys.argv[1]
port = sys.argv[2]
server = ThreadServer(host, int(port), Handlers)
server.serve()

服务端通过kazoo连接zookeeper,依次创建根节点和服务的子节点,当启动多线程服务器的时候,会根据ip和端口创建不同的节点,依次启动两个server(8001、8002),查看zookeeper的节点信息:

 >>> from kazoo.client import KazooClient
>>> zk = KazooClient(hosts='127.0.0.1:2181')
>>> zk.start()
>>> children = zk.get_children("/rpc")
>>> print(children)
['server0000000001', 'server0000000000']

客户端:

 import random
import time
import json
import socket
from divide_rpc import (
ClientStub, InvalidOperation
)
from kazoo.client import KazooClient class DistributedChannel(object):
def __init__(self):
self._zk = KazooClient(hosts='127.0.0.1:2181')
self._zk.start()
self._get_servers() def _get_servers(self, event=None):
"""
从zookeeper获取服务器地址信息列表
"""
servers = self._zk.get_children('/rpc', watch=self._get_servers)
print(servers)
self._servers = []
for server in servers:
data = self._zk.get('/rpc/' + server)[0]
if data:
addr = json.loads(data.decode())
self._servers.append(addr) def _get_server(self):
"""
随机选出一个可用的服务器
"""
return random.choice(self._servers) def get_connection(self):
"""
提供一个可用的tcp连接
"""
while True:
server = self._get_server()
print(server)
try:
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.connect((server['host'], server['port']))
except ConnectionRefusedError:
time.sleep(1)
continue
else:
break
return sock channel = DistributedChannel() for i in range(50):
try:
stub = ClientStub(channel)
val = stub.divide(i)
except InvalidOperation as e:
print(e.message)
else:
print(val)
time.sleep(1)

客户端连接zookeeper,通过get_children来获取服务器信息,并watch监听服务器的变化情况,启动客户端会发现它会调用8001端口的server和8002端口的server:

使用Kazoo操作ZooKeeper服务治理

此时服务端新增加一个结点,8003,客户端变化情况:

使用Kazoo操作ZooKeeper服务治理

可以看出zookeeper总共有三个节点了,前面调用的server都是8001和8002,当8003加入后,zookeeper会发现并调用它

此时服务端断开一个server,8001,客户端变化情况:

使用Kazoo操作ZooKeeper服务治理

断开server前客户端会调用8001、8002、8003这三个服务,当断开server 8001以后,zookeeper只会调用8002和8003这两个server了

上一篇:[20181124]关于降序索引问题3.txt


下一篇:[Tensorflow] Object Detection API - retrain mobileNet