[数据库]《高可用mysql》读书笔记

第一章:引言

复制:就是复制一个服务器上的所有改变到另一个服务器

备份的功用:错误保护,建立新服务器,法律原因

监控:不监控就无法观察到有问题的查询、过热的从节点、使用不恰当的表等

第二章:mysql复制原理

1.配置master、slave、master和slave之间的连接

2.二进制日志简介

 1)在复制中的作用:slave通过二进制日志获取master上的改变
 2)事件:event_type、server_id、log_name、pos、end_log_pos、info

3.二进制日志结构和内容

[数据库]《高可用mysql》读书笔记

第三章:二进制日志


二进制日志的结构

binlog事件的结构:5.0以后为版本4,设计为可扩展的,如果开发者做了重大改动,版本会变化

 组成:1)通用头,2)提交头,3)事件体

注意:

1.事务在master上交错执行,但事务在二进制日志中的顺序不变,取决于事务的提交时间
2.如果服务器突然停止或死机,binlog末尾可能不是轮换事件


记录语句

1.记录DML及DDL语句

2.上下文:

 指服务器执行语句时必须知道的隐式信息,如:当前数据库、RAND函数的种子、当前时间、AUTO_INCREMENT字段的插入值、调用LAST_INSERT_ID的返回值、线程ID
 与语句有关的隐式信息需要满足:包含对用户定义变量的引用; 包含RAND函数的种子(需要将伪随机种子写入日志); LASTER_INSERT_ID;AUTO_INCREMENT;
 二进制日志通过如下事件来存储上下文信息:User_var; Rand; Intvar;

3.LOAD DATA INFILE:

 采用一套特殊的事件来用二进制日志处理文件传输
 引入的新事件:Begin_load_query; Append_block; Execute_load_query; 

4.二进制日志过滤器

 binlog-do-db和binlog-ignore-db  

5.触发器、事件和存储过程

 触发器:在slave上必需(基于语句的复制)
 存储过程:
     注意:1)CALL语句没有被写入二进制日志,而是将存储过程的主体展开后放入二进制日志
           2)对存储过程参数的引用被改写为NAME_CONST函数
           3)局部声明的变量pass也换成NAME_CONST函数
           4)调用存储过程的语句以Intvar事件作为前缀,且包含insert ID
 Event:在slave上被自动禁止

6.特殊结构

 LOAD_FILE函数:获取文件的函数,但slave上必须要有此文件,才能被正确执行。
 解决方案:1)将文件上传至slave;  2)使用LOAD DATA INFILE重写;  3)在用户变量中存储文件内容;

7.非事务性的变化和错误处理

 例:INSERT INTO table(column) values ('xxx');
 ERROR 1062:Duplicate entry 'xxx' for key 'PRIMARY'
 此语句仍会被二进制日志记录,但master会通过Query事件中的一个错误代码字段登记二进制日志。这个错误代码在SHOW BINLOG EVENT看不到,通过mysqlbinlog可查看


记录事务

默认提交的语句:

 1)写文件的语句; 2)修改数据库中表的语句; 3)锁表、管理、LOAD DATA INFILE语句

事务缓存:

 非事务性语句不会导致当前事务的结束
 记录非事务性语句的规则:
 1)如果语句被标记为事务的,它将被写入事务缓存
 2)如果语句没有被标记为事务性的,而且事务缓存中无此语句,该语句被直接写入事务缓存
 3)如果没有被标记为事务性的,但是事务缓存中有语句,则该语句被写入事务缓存  左边:不应用规则3产生的不良影响  右边:应用规则3的实际情况
 
 避免非事务性语句的复制问题:确保在事务中首先被写入


二进制日志管理

系统崩溃安全:调整sync-binlog

Binlog文件轮换:

 导致轮换的活动:
 1)服务器停止    情景1:服务器停止后被升级
 2)binlog文件达到预设的最大尺寸
 3)Binlog被显式刷新  flush logs
 4)事故发生
 

Binlog文件的第一个事件:格式描述(format description)

 3个有趣项目:
 1)binlog-in-use flag  标记binlog文件是否被正确关闭
 2)binlog版本
 3)服务器版本  协助开发者找出微小错误

二进制日志中的两种事故标记(incident):

 1)stop  表明服务器已通过正常手段停止
 2)incident  包含标识符来指定是哪种类型的事故,slave会因此错误停止


第四章:基于复制的数据库高可用技术                                                                     

双master

 两种模式:active-active(两台同时写);active-passive(一台写,另一台被动)
 使用如下两个变量处理双master上同时写带来的冲突
 auto_increment_offset:自增列的起始值
 auto_increment_increment:自增列下一个值的增量


半同步复制

 理念:允许更改操作继续执行前,确保操作至少被写入一个slave的磁盘。即slave被告知事务已经在持久存储中后,master的客户端才返回提交指令

第五章:Mysql集群的横向扩展

级联复制:添加log-slave-updates选项配置中继服务器发送slave线程事件,并使用blackhole存储引擎提高性能

第六章:高级复制


多源复制

 即一个slave连接多个master。需要处理的冲突如下图:  解决方案:轮询多个master。官方暂未提供此功能,可使用python实现。


基于行的复制

binlog-format:STATEMENT; ROW; MIXED;

混合模式中会切换到基于行的复制的不安全的情况:
1)语句调用了UUID函数,用户自定义函数,CURRENT_USER,USER函数,LOAD_FILE函数
2)同一个语句更改了两张或更多包含AUTO_INCREMENT列的表
3)语句中使用了服务器变量
4)存储引擎不允许使用基于语句的复制,比如mysql cluster引擎

个人认为尽量选用ROW格式的复制,其次是MIXED,最后是最不安全的STATEMENT。

行事件的结构:

[数据库]《高可用mysql》读书笔记 
mysql闪回即是依据基于行的原理实现


参考文献:《高可用mysql的:构建健壮的数据中心

上一篇:Python学习笔记--在CentOS 6上升级Python至2.7版本


下一篇:Uber 时序数据库M3DB初探