mongodb是最常用的nosql数据库,在数据库排名中已经上升到了前六。这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群。
在搭建集群之前,需要首先了解几个概念:路由,分片、副本集、配置服务器等。
相关概念
从图中可以看到有四个组件:mongos、config server、shard、replica set。
1.mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。2.config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!3.shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。4.replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。5.仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。
简单了解之后,我们可以这样总结一下,应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失同步在副本集中存储了一份,仲裁在数据存储到分片的时候决定存储到哪个节点。
环境准备
系统系统 Ubuntu 18.04.1 LTS 三台服务器:10.20.71.135/10.20.73.182/10.20.70.61 安装包:mongodb-org-server_4.0.6_amd64.deb
服务器规划
服务器mongo-135 | 服务器mongo-182 | 服务器mongo-61 |
mongos | mongos | mongos |
config server | config server | config server |
shard server1 主节点 | shard server1 副节点 | shard server1 仲裁 |
shard server2 仲裁 | shard server2 主节点 | shard server2 主节点 |
shard server3 副节点 | shard server3 仲裁 | shard server3 主节点 |
端口分配:
mongos:20000
config:21000
shard1:27017
shard2:27017
shard3:27017
集群搭建
1. mongodb源配置
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4
echo "deb [ arch=amd64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-4.0.list
sudo apt-get update
会安装对应源的mongo所有依赖包,此处不执行
# sudo apt-get install -y mongodb-org
echo "mongodb-org hold" | sudo dpkg --set-selections
echo "mongodb-org-server hold" | sudo dpkg --set-selections
echo "mongodb-org-shell hold" | sudo dpkg --set-selections
echo "mongodb-org-mongos hold" | sudo dpkg --set-selections
echo "mongodb-org-tools hold" | sudo dpkg --set-selections
# 安装依赖
apt install -y mongodb-org-mongos mongodb-org-shell mongodb-org-tools
参考
2. mongodb安装
wget https://repo.mongodb.org/apt/ubuntu/dists/bionic/mongodb-org/4.0/multiverse/binary-amd64/mongodb-org-server_4.0.6_amd64.deb
dpkg -i mongodb-org-server_4.0.6_amd64.deb
分别在每台机器建立conf、mongos、config、shard1、shard2、shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。
mkdir -p /usr/local/mongodb/conf
mkdir -p /usr/local/mongodb/mongos/log
mkdir -p /usr/local/mongodb/configsvr/{data,log}
mkdir -p /usr/local/mongodb/shard1/{date,log}
mkdir -p /usr/local/mongodb/shard2/{data,log}
mkdir -p /usr/local/mongodb/shard3/{data,log}
准备集群间通信使用的加密key
创建mongod、mongos之间通信所使用的key文件,在任意一台服务器上执行:
openssl rand -base64 756 > /etc/mongodb/conf/key
chmod 400 /data/mongodb/conf/key
# 将/data/mongodb/conf/key文件拷贝到其它服务器上,保持文件权限不变
connfig server配置服务器
mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。添加配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat configsrv.conf
storage:
dbPath: /data/mongodb/config/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/config/log/configsrv.log
net:
port: 21000
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: configs
sharding:
clusterRole: "configsvr"
分别启动三台服务器的config server 方式一:
mongod -f /data/mongodb/conf/configsrv.conf
方式二:
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongosrv.service
[Unit]
Description=MongoDB Database Config Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/configsrv.conf
PIDFile=/data/mongodb/config/log/configsrv.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
systemctl daemon-reload
systemctl start mongosrv.service
systemctl enable mongosrv.service
登录任意一台配置服务器,初始化配置副本集
#连接
mongo --port 21000
#config变量
config = {
_id : "configs",
members : [
{_id : 0, host : "10.20.71.135:21000" },
{_id : 1, host : "10.20.73.182:21000" },
{_id : 2, host : "10.20.70.61:21000" }
]
}
#初始化副本集
rs.initiate(config)
其中,”_id” : “configs”应与配置文件中配置的 replicaction.replSetName 一致,”members” 中的 “host” 为三个节点的 ip 和 port
配置分片副本集(三台机器)
设置第一个分片副本集(shard1)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard1.conf
storage:
dbPath: /data/mongodb/shard1/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard1/log/shard1.log
net:
port: 27017
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard1
sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard1.service
[Unit]
Description=MongoDB Shard1 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard1.conf
PIDFile=/data/mongodb/shard1/log/shard1.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard1.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard1.service
启动方式二:
mongod -f /data/mongodb/conf/shard1.conf
登陆任意一台服务器,初始化副本集:
在任意一台服务上初始化复制集配置:
mongo --port 27017
#使用admin数据库
use admin
#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard1",
members : [
{_id : 0, host : "10.20.71.135:27017" },
{_id : 1, host : "10.20.73.182:27017" },
{_id : 2, host : "10.20.70.61:27017", arbiterOnly: true }
]
}
#初始化副本集配置
rs.initiate(config);
rs.status()
rs.conf()
设置第二个分片副本集(shard2)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard2.conf
storage:
dbPath: /data/mongodb/shard2/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard2/log/shard2.log
net:
port: 27018
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard2
sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard2.service
[Unit]
Description=MongoDB Shard2 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard2.conf
PIDFile=/data/mongodb/shard2/log/shard2.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard2.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard2.service
启动方式二:
mongod -f /data/mongodb/conf/shard2.conf
登陆任意一台服务器,初始化副本集:
在任意一台服务上初始化复制集配置:
mongo --port 27018
#使用admin数据库
use admin
#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard2",
members : [
{_id : 0, host : "10.20.71.135:27018" },
{_id : 1, host : "10.20.73.182:27018", arbiterOnly: true },
{_id : 2, host : "10.20.70.61:27018" }
]
}
#初始化副本集配置
rs.initiate(config);
设置第二个分片副本集(shard3)
1. 配置文件
root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard3.conf
storage:
dbPath: /data/mongodb/shard3/data
journal:
enabled: true
systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard3/log/shard3.log
net:
port: 27019
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
authorization: enabled
replication:
replSetName: shard3
sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard3.service
[Unit]
Description=MongoDB Shard3 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard3.conf
PIDFile=/data/mongodb/shard3/log/shard3.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard3.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard3.service
启动方式二:
mongod -f /data/mongodb/conf/shard3.conf
登陆任意一台服务器,初始化副本集:
mongo --port 27019
use admin
#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard3",
members : [
{_id : 0, host : "10.20.71.135:27019",arbiterOnly: true },
{_id : 1, host : "10.20.73.182:27019" },
{_id : 2, host : "10.20.70.61:27019" }
]
}
#初始化副本集配置
rs.initiate(config);
配置路由服务器 mongos
先启动配置服务器和分片服务器,后启动路由实例:(三台机器) 1. 配置文件
systemLog:
destination: file
logAppend: true
path: /data/mongodb/mongos/log/mongos.log
net:
port: 20000
bindIp: 0.0.0.0
processManagement:
timeZoneInfo: /usr/share/zoneinfo
security:
keyFile: /data/mongodb/conf/key
clusterAuthMode: keyFile
replication:
localPingThresholdMs: 15
sharding:
#监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字
configDB: "configs/10.20.71.135:21000,10.20.73.182:21000,10.20.70.61:21000"
2. 制作服务启动文件
root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongos.service
[Unit]
Description=MongoDB Mongos Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual
[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongos --config /data/mongodb/conf/mongos.conf
PIDFile=/data/mongodb/mongos/log/mongos.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false
# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings
[Install]
WantedBy=multi-user.target
启动方式一:
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl enable mongos
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongos.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongos.service
启动方式二:
mongod -f /data/mongodb/conf/shard3.conf
3. 启用分片 目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。
mongo --port 20000
#使用admin数据库
use admin
#串联路由服务器与分配副本集
sh.addShard("shard1/10.20.71.135:27017,10.20.73.182:27017,10.20.70.61:27017")
sh.addShard("shard2/10.20.71.135:27018,10.20.73.182:27018,10.20.70.61:27018")
sh.addShard("shard3/10.20.71.135:27019,10.20.73.182:27019,10.20.70.61:27019")
#查看集群状态
sh.status()
⚠️ : 集群服务启动顺序 mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos. configsvr->shard->mongos 至此,整个mongodb高可用集群就搭建好了。
部署测试
1. 先建一个database及user创建数据
# 创建一个admin用户
$ mongo --port 20000
> use admin
> db.createUser({ user: "weadmin", pwd: "123456",roles: [{ role: "userAdminAnyDatabase", db: "admin" },{ role: "clusterManager", db : "admin"}],passwordDigestor: "server"})
> exit
# 创建一个database的访问用户
$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use test
> db.createUser({user: "test",pwd: "123456",roles: [{ role: "dbOwner", db: "test" }],passwordDigestor: "server"});
> exit
# 使用该用户访问database,并插入数据,创建索引
$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
#插入测试数据
> for (var i = 1; i <= 5000; i++){db.table1.save({id:i,"name":"shuke"})};
> exit
2. 分片生效 目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。
$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use admin
# 认证
> db.auth("weadmin", "123456")
#指定testdb分片生效
db.runCommand( { enablesharding :"test"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "test.table1",key : {id: 1} } )
我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!
3. 测试分片配置结果:
$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
> use test
> db.auth("test", "123456")
#查看分片情况
> db.table1.stats();
总结
手工部署mongodb集群还是比较麻烦的,所以如果图省事儿,还是使用云厂商提供的PaaS服务好了,比如云数据库 MongoDB。如果一定要自己搭建,还是建议用现成的ansible-mongodb-cluster脚本好了。