为什么用复制
为什么要使用复制呢?如果我们的数据库只存在于一台服务器,若这台服务器宕机了,那对于我们数据将会是灾难,当然这只是其中一个原因,若数据量非常大,读写操作势必会影响数据库的性能,这时候复制就显得相当重要了,因为 MongoDB 可以通过复制,实现读写分离。
复制是一种在多个服务器上同步数据的过程。通过在不同的数据库服务器上实现多个数据副本。总之,复制可以使你免受硬件故障与服务中断的影响,及时恢复数据。由于数据有多个副本,所以可以将其中一个副本用于灾难恢复、报告或备份。
复制的作用
- 保证数据的安全性
- 保证数据的高可用性(24*7)
- 用户灾难恢复
- 不需要停机维护(如备份,重建索引,压缩等任务)
- 读写的灵活性
那么,复制是怎么实现的呢?MongoDB 用副本集实现复制的功能。副本集是一组托管同一数据集的 mongod 对象。在副本集中有三个成员:主节点(Primary)、从节点(Secondary)、仲裁节点(Arbiter)
副本集
先对副本集成员进行说明:
主节点(Primary)
提供所有增、删、查、改操作
从节点(Secondary)
可以提供查询服务,这样就可以减少主节点的压力,当客户端进行数据查询时,请求自动转到从节点上。
仲裁节点(Arbiter)
仲裁节点是一种特殊的节点,它本身并不存储数据,主要作用在于,当主节点挂掉以后,通过投票的方式决定哪个从节点成为主节点。如果没有仲裁节点,如果主节点挂掉,那么整个副本集中就没有了主节点。
那么,副本集是怎么实现主、从节点的数据同步的呢?原来,主节点上的所有操作都记录在oplog,从节点定期从主节点获取这些操作,然后对自己的数据副本执行这些操作,从而保证从节点的数据与主节点一致。
- 副本集具有 2 个或多个节点(但一般最少需要 3 个节点)。
- 副本集只有一个主节点,其他全是从节点。
- 所有数据都是从主节点复制到从节点上的。
- 当发生自动故障转移或维护时,会重新推举一个新的主节点。
- 当失败节点恢复后,该节点重新又连接到副本集中,重新作为从节点。
下面展示一下典型的 MongoDB 复制图,客户端从主节点读取数据,在客户端写入数据到主节点时, 主节点与从节点进行数据交互保障数据的一致性。
副本集特点
- 具有 N 个节点的集群
- 任何节点都可能成为主节点
- 所有写入操作必须由主节点来完成
- 自动故障转移
- 自动故障恢复
- 重新推举主节点
创建副本集
1、关闭正在运行的 MongoDB 服务器
2、通过指定 --replSet 选项来启动mongoDB。--replSet 基本语法格式如下:
mongod --port "PORT" --dbpath "YOUR_DB_DATA_PATH" --replSet "REPLICA_SET_INSTANCE_NAME"
范例
因为没有安装虚拟机,就把 MongoDB 文件夹放在C盘、D盘、E盘、F盘,模拟放在多个服务器上。
1、先启动C盘上的 MongoDB 服务器:127.0.0.1:27017,指定端口为27017,并取副本集的名称为 "myRep"
mongod --port 27017 --dbpath c:\data\db --replSet myRep
2、然后启动D盘上的 MongoDB 服务器:127.0.0.1:27020,指定端口为27020,并取副本集的名称为 "myRep"
mongod --port 27020 --dbpath d:\data\db --replSet myRep
3、MongoDB 中用 rs.initiate() 命令初始化一个副本集,打开C盘上的 Mongo shell,输入以下命令
rs.initiate(
{
_id: "myRep",
members: [
{ _id: 0, host : "127.0.0.1:27017" },
{ _id: 1, host : "127.0.0.1:27020" }
]
}
)
4、除了用 rs.initiate() 命令初始化副本集外,MongoDB 还可以用 rs.add(HOST_NAME:PORT),给副本集添加节点。请记住,使用 rs.add() 之前,一定要用 rs.initiate() 初始化副本集,没有参数也可以。我们先启动E盘上 MongoDB 服务器:127.0.0.1:27022,指定端口为27022,并取副本集的名称为 "myRep"
mongod --port 27022 --dbpath e:\data\db --replSet myRep
5、我们用 rs.add() 命令添加一个节点。把服务连接到 主节点 上,在 Mongo shell 中输入以下命令
rs.add("127.0.0.1:27022")
6、没有仲裁节点的副本集是不完整的,MongoDB 中使用 rs.addArb(HOST_NAME:PORT) 命令添加仲裁节点。我们先启动F盘上 MongoDB 服务器:127.0.0.1:27030,指定端口为27030,并取副本集的名称为 "myRep"
mongod --port 27030 --dbpath f:\data\db --replSet myRep
7、我们用 rs.addArb() 命令添加一个仲裁节点。把服务连接到 主节点 上,在 Mongo shell 中输入以下命令
rs.addArb("127.0.0.1:27030")
8、MongoDB 可以使用 rs.status() 命令查看副本集的状态,可以清楚的看出哪个服务器是主节点,哪个服务器是从节点,哪个服务器是仲裁节点。在返回的结果中,members 文档中可以清楚的看到字段 stateStr 的值,该值标识服务器属于哪个类型的节点。通过返回结果可以看到C盘的 MongoDB 服务器是主节点。因为 status() 返回的结果太长,我就不截图了。
9、副本集已经建好了,是不是特别想试试它的奥秘啊,我们用 Mongo shell连接到主节点服务器,添加 user 集合,并添加文档
mongodb://127.0.0.1:27017 #连接主节点服务器
...db
test
myRep:PRIMARY>db.user.insert({"name":"liruihuan","age":18})
10、我们再连接到D盘上的服务器:127.0.0.1:27020,查看 test 数据库中是否有 user 集合,如果有,并查看 user 中的文档。
mongodb://127.0.0.1:27020 #连接D盘上的服务器
...db
test
myRep:PRIMARY>show collections #查看数据库 test 中的集合
user
myRep:PRIMARY>db.user.find()
{"_id" : ObjectId("58f0857b54caa5a0e463db06"), "name" : "liruihuan", "age" : 18}
myRep:PRIMARY>
哇,我们发现D盘上的服务器已经存在数据了。
业精于勤,荒于嬉;行成于思,毁于随。
如果你觉得这篇文章不错或者对你有所帮助,可以通过右侧【打赏】功能,给予博主一点点鼓励和支持