原文地址:http://ultrasql.blog.51cto.com/9591438/1636374
Memcached集群介绍
由于Memcached服务器与服务器之间没有任何通讯,并且不进行任何数据复制备份,所以当任何服务器节点出现故障时,会出现单点故障,如果需要实现HA,则需要通过另外的方式来解决。
通过Magent缓存代理,防止单点现象,缓存代理也可以做备份,通过客户端连接到缓存代理服务器,缓存代理服务器连接缓存连接服务器,缓存代理服务器可以连接多台Memcached机器可以将每台Memcached机器进行数据同步。如果其中一台缓存服务器down机,系统依然可以继续工作,如果其中一台Memcached机器down掉,数据不会丢失并且可以保证数据的完整性。
搭建Memcached集群
Magent的架构方案已经在上一篇博文《Magent介绍》中有详细描述。现以如下图示例架构方案说明Magent如何搭建Memcached集群,而在生产环境需要根据自身业务特点设计健壮的架构方案。
现有测试机:192.168.11.51/52/68
先在三台测试机上安装好libevent和memcached,启动memcached实例;
然后在51和52上安装好magent,启动magent实例。
安装和启动memcached实例
详细步骤,请参见之前的博文《Memcached 1.4.22安装和配置》,分别启动如下实例:
1
2
3
|
/usr/local/bin/memcached -d -m 256 -u memcached -l 192.168.11.51 -p 11211 -c 1024 -P /var/run/memcached/memcached .pid
/usr/local/bin/memcached -d -m 256 -u memcached -l 192.168.11.52 -p 11211 -c 1024 -P /var/run/memcached/memcached .pid
/usr/local/bin/memcached -d -m 256 -u memcached -l 192.168.11.68 -p 11211 -c 1024 -P /var/run/memcached/memcached .pid
|
安装和启动magent实例
笔者在测试magent-0.6.tar.gz时,该版本在与最新版memcached运行下不够稳定,如下配置以magent-0.5.tar.gz为示例。
1. 安装magent到/usr/local下:
1
2
3
4
5
6
|
cd /usr/local mkdir magent
cd magent
wget http: //memagent .googlecode.com /files/magent-0 .5. tar .gz
(若无法直接访问,可先下载安装包后上传到服务器上) tar zxvf magent-0.5. tar .gz
|
2. 修改配置:
在ketama.h文件开头添加
1
2
3
|
#ifndef SSIZE_MAX #define SSIZE_MAX 32767 #endif |
1
2
3
4
|
ln -s /usr/lib64/libm .so /usr/lib64/libm .a
/sbin/ldconfig sed -i "s#LIBS = -levent#LIBS = -levent -lm#g" Makefile
vi Makefile
|
将
1
|
CFLAGS = -Wall -O2 -g |
修改为:
1
|
CFLAGS = -lrt -Wall -O2 -g |
保存
3. 编译:
1
|
make |
输出如下信息:
1
2
3
|
gcc -lrt -Wall -O2 -g -c -o magent.o magent.c gcc -lrt -Wall -O2 -g -c -o ketama.o ketama.c gcc -lrt -Wall -O2 -g -o magent magent.o ketama.o -levent –lm |
4. 查看命令帮助:
1
|
. /magent –h
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
memcached agent v0.4 Build-Date: Apr 21 2015 09:21:10 Usage: -h this message -u uid -g gid -p port, default is 11211. (0 to disable tcp support) -s ip:port, set memcached server ip and port -b ip:port, set backup memcached server ip and port -l ip, local bind ip address, default is 0.0.0.0 -n number, set max connections, default is 4096 -D don't go to background -k use ketama key allocation algorithm -f file, unix socket path to listen on. default is off -i number, set max keep alive connections for one memcached server, default is 20 -v verbose |
5. 启动magent实例
1
2
|
/usr/local/magent/magent -u root -n 4096 -l 192.168.11.51 -p 11200 -s 192.168.11.51:11211 -s 192.168.11.52:11211 -b 192.168.11.68:11211
/usr/local/magent/magent -u root -n 4096 -l 192.168.11.52 -p 11200 -s 192.168.11.51:11211 -s 192.168.11.52:11211 -b 192.168.11.68:11211
|
测试流程
登录51上的magent,存储key1到key5:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
[root@mongo01 ~]# telnet 192.168.11.51 11200 Trying 192.168.11.51... Connected to 192.168.11.51. Escape character is '^]'. stats memcached agent v0.4 matrix 1 -> 192.168.11.51:11211, pool size 0 matrix 2 -> 192.168.11.52:11211, pool size 0 END set key1 0 0 1 1 STORED set key2 0 0 2 22 STORED set key3 0 0 3 333 STORED set key4 0 0 4 4444 STORED set key5 0 0 5 55555 STORED quit Connection closed by foreign host. |
登录到51上的memcached,获取到了key2和key4:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
[root@mongo01 ~]# telnet 192.168.11.51 11211 Trying 192.168.11.51... Connected to 192.168.11.51. Escape character is '^]'. get key1 END get key2 VALUE key2 0 2 22 END get key3 END get key4 VALUE key4 0 4 4444 END get key5 END quit Connection closed by foreign host. |
登录到52上的memcached,获取到了key1、key3和key5:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
[root@mongo02 ~]# telnet 192.168.11.52 11211 Trying 192.168.11.52... Connected to 192.168.11.52. Escape character is '^]'. get key1 VALUE key1 0 1 1 END get key2 END get key3 VALUE key3 0 3 333 END get key4 END get key5 VALUE key5 0 5 55555 END quit Connection closed by foreign host. |
登录到68上的memcached,获取到了key1到key5:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
[root@szlnmp01 ~]# telnet 192.168.11.68 11211 Trying 192.168.11.68... Connected to 192.168.11.68. Escape character is '^]'. get key1 VALUE key1 0 1 1 END get key2 VALUE key2 0 2 22 END get key3 VALUE key3 0 3 333 END get key4 VALUE key4 0 4 4444 END get key5 VALUE key5 0 5 55555 END quit Connection closed by foreign host. |
停掉52的memcached进程,通过51上的magent获取到了key1到key5:
1
|
kill ` cat /var/run/memcached/memcached .pid`
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
[root@mongo01 magent]# telnet 192.168.11.51 11200 Trying 192.168.11.51... Connected to 192.168.11.51. Escape character is '^]'. get key1 VALUE key1 0 1 1 END get key2 VALUE key2 0 2 22 END get key3 VALUE key3 0 3 333 END get key4 VALUE key4 0 4 4444 END get key5 VALUE key5 0 5 55555 END quit Connection closed by foreign host. |
恢复52的memcached进程,通过51上的magent,只获取到了key2和key4:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
[root@mongo01 ~]# telnet 192.168.11.51 11200 Trying 192.168.11.51... Connected to 192.168.11.51. Escape character is '^]'. get key1 END get key2 VALUE key2 0 2 22 END get key3 END get key4 VALUE key4 0 4 4444 END get key5 END quit Connection closed by foreign host. |
通过以上测试可以得出结论:
1. 通过magent的连接池存放的值会分别存在magent代理的所有memcached上去。
2. 如果有一个memcached宕机通过magent代理方式还能取到值。
3. 如果memcached修复重启后通过magent代理方式取到的值就会为Null,这是由于memcache重启后里边的值随着memcache服务的停止就消失了(因为在内存中),但是magent是通过key进行哈希计算分配到某台机器上的,memcache重启后会还从这台机器上取值,所有取到的值就为空。
解决办法:
1. 在每次memcache宕机修复后可以写一个程序把集群中的其他memcache的所有信息全给拷贝到当前宕机修复后的memcache中。
2. 自己写代理,当从一个memcached服务上取到的值为Null时再去其他memcached上取值。
注意事项:
magent的调用方式同memcached一样,客户端可以不用改代码即可实现切换到magent模式下。
缓存与DB的同步
比较保险的做法是:查询的时候从缓存中取,add、updae、delete的时候同时操作缓存与DB。
当然你也可以定时同步缓存与DB的数据,不同的业务应该有不同的选择。
magent-0.6版本相关的错误汇总
产生如下错误:
1
2
3
4
5
6
|
gcc -Wall -g -O2 -I/usr/local/include -m64 -c -o magent.o magent.c magent.c: In function ‘writev_list’: magent.c:729: error: ‘SSIZE_MAX’ undeclared (first use in this function) magent.c:729: error: (Each undeclared identifier is reported only once magent.c:729: error: for each function it appears in.) make: *** [magent.o] Error 1 |
解决方法:
在ketama.h文件开头添加
1
2
3
|
#ifndef SSIZE_MAX #define SSIZE_MAX 32767 #endif |
再次make
产生如下错误:
1
2
3
4
5
6
7
|
gcc -Wall -g -O2 -I/usr/local/include -m64 -c -o magent.o magent.c gcc -Wall -g -O2 -I/usr/local/include -m64 -c -o ketama.o ketama.c gcc -Wall -g -O2 -I/usr/local/include -m64 -o magent magent.o ketama.o usr/lib64/libevent.a /usr/lib64/libm.a gcc: /usr/lib64/libevent.a: No such file or directory gcc: /usr/lib64/libm.a: No such file or directory make: *** [magent] Error 1 |
解决方法:
1
2
|
ln -s /usr/lib64/libm .so /usr/lib64/libm .a
vi Makefile
|
找到LIBS = /usr/lib64/libevent.a /usr/lib64/libm.a
按照如下格式修改:
LIBS = /usr/<libevent的安装路径>/libevent.a /usr/lib64/libm.a
如:LIBS = /usr/lib/libevent.a /usr/lib64/libm.a
保存
再次make
产生如下错误:
1
2
3
4
5
6
7
|
gcc -Wall -g -O2 -I/usr/local/include -m64 -o magent magent.o ketama.o /usr/lib/libevent.a /usr/lib64/libm.a /usr/lib/libevent.a(event.o): In function `gettime': /tmp/libevent-2.0.22-stable/event.c:370: undefined reference to `clock_gettime' /usr/lib/libevent.a(event.o): In function `detect_monotonic': /tmp/libevent-2.0.22-stable/event.c:340: undefined reference to `clock_gettime' collect2: ld returned 1 exit status make: *** [magent] Error 1 |
解决方法:
1
|
vi Makefile
|
将
1
|
CFLAGS = -Wall -g -O2 -I/usr/local/include $(M64) |
修改为:
1
|
CFLAGS = -lrt -Wall -g -O2 -I/usr/local/include $(M64) |
保存
再次make
输出为:
1
|
gcc -lrt -Wall -g -O2 -I/usr/local/include -m64 -o magent magent.o ketama.o /usr/lib/libevent.a /usr/lib64/libm.a |