MySQL 5.7基于GTID复制的常见问题和修复步骤(二)

2023-02-25 08:32:41

【问题二】

有一个集群（MySQL5.7.23）切换后复制slave报1236，其实是不小心在slave上执行了事务导致

Got fatal error 1236 from master when reading data from binary log: 'The slave is connecting using CHANGE MASTER TO MASTER_AUTO_POSITION = 1, but the master has purged binary logs containing GTIDs that the slave requires.

【产生原因】

定时任务在执行flush slow logs前未加set sql_log_bin=0;导致在slave上执行时，slave上的GTID增长，当binlog日志被purge后，发生MHA切换后就会报出上面的错误。

【修复步骤】

下面描述正确的处理步骤：

1、切换后如果出现replication报错，第一时间先关闭master的binlog备份

2、修复导致slave事务增长的job脚本set sql_log_bin=0; flush slow logs

3、slave上stop slave;

4、master上show global variables like '%gtid%';记录gtid_purged，gtid_executed值

5、slave上reset master;

6、slave上set global gtid_purged='3d9ade83-7cea-11e5-bc12-d89d6725f98c:1-863017556,

8fad86b1-8980-11e8-873d-40a8f024a124:1-24531;

这里需要注意，设置的值应该是上面截图红色框两段组合的值，这样才能保证再次切换后复制正常

7、slave上start slave;

对于这次的场景，按上次步骤恢复后会丢失8fad86b1-8980-11e8-873d-40a8f024a124:1-24531这段事务，但这段事务实际上是flush slow logs事务，并不影响业务数据，因此理论上数据会一致

上述方法修复后，建议用pt-table-checksum工具，检验主从数据的一致性。

复制相关的文章

MySQL 5.7基于GTID复制的常见问题和修复步骤(一)

码农公寓

相关文章