目前未在生产环境中升级过数据库版本,倒是在测试环境跟开发环境升级过。
可以通过mysqldump sql文件进行升级,也可以通过mysql_upgrade升级,前者耗时较长,且需要足够量的磁盘空间,本文暂不讨论,升级使用mysql_upgrade方式。
如果是线上环境升级,常规来说分为以下几个步骤:
- 从库先升级
- 业务迁移,从库上若有只读业务或者其他,迁移到其他DB实例
- 从库备份
- 从库停止复制
- 升级
- 从库恢复复制(升级后主库仍是5.6版本,从库是5.7版本,注意是否有异常)
- 主从恢复正常
- 主从切换
- 新从库升级
- 新从库停止复制
- 新从库备份
- 升级
- 新从库恢复复制
- 主从恢复正常
- 恢复相关业务
本文主要记录升级的详细步骤、主库5.6从库5.7有哪些问题以及如何从传统模式转变为GTID模式。
1 MySQL5.6升级到5.7版本
升级步骤简要如下:
- 安装新版本mysql,从库服务器安装5.7版本mysql
- 修改安装目录配置参数,修改从库的mysql配置文件,把 mysql 安装目录修改为 5.7版本的安装目录
- 关闭从库mysql服务
- 新版本mysql启动实例,使用5.7版本mysql启动待升级实例
- 升级字典,使用mysql_upgrade升级字典
- 检查,查看mysql log日志
#1 安装新版本mysql
## 下载mysql5.7.17,拷贝到server下的/opt文件目录下
## 解压,创建软连接,授权
tar zvxf mysql-5.7.17-linux-glibc2.5-x86_64.tar.gz
ln -s /opt/mysql-5.7.17-linux-glibc2.5-x86_64 /usr/local/mysql57
chown -R mysql:mysql /usr/data/mysql57 #2 修改配置参数
## 检查配置文件中那些配置是使用到了 安装目录,把使用到底都修改
旧:
basedir = /usr/local/mysql56
plugin-dir = /usr/local/mysql56/lib/plugin/ 新:
basedir = /usr/local/mysql
plugin-dir = /usr/local/mysql/lib/plugin/ #3 关闭mysql
[root@sutest244 mysqlup]# /usr/local/mysql56/bin/mysqladmin --socket=/tmp/mysql3399.sock -uroot -p shutdown
Enter password:
[root@sutest244 mysqlup]# ps axu | grep mysql3399 | grep mysqld
[root@sutest244 mysqlup]# #4 新版本启动mysql
[root@sutest244 mysqlup]# /usr/local/mysql/bin/mysqld --defaults-file=/data/mysqlup/mysql3399.cnf &
[1] 15477
[root@sutest244 mysqlup]# ps axu | grep mysql3399 | grep mysqld
mysql 15477 37.1 26.7 11931672 1037520 pts/4 Sl 03:34 0:05 /usr/local/mysql/bin/mysqld --defaults-file=/data/mysqlup/mysql3399.cnf
[root@sutest244 mysqlup]#
[root@sutest244 mysqlup]# vim /data/mysqlup/data/error.log #4.1 检查
检查启动后的错误日志,看下是否有配置参数报错,如果有,修改
错误日志会有大量的字典信息报错,这个暂不处理,下个步骤修复 #5 升级字典
[root@sutest244 bin]# /usr/local/mysql/bin/mysql_upgrade --socket=/tmp/mysql3399.sock -uroot -p
Enter password:
Checking if update is needed.
Checking server version.
Running queries to upgrade MySQL server.
Checking system database.
mysql.columns_priv OK
mysql.db OK
mysql.engine_cost OK
mysql.event OK
mysql.func OK
mysql.general_log OK
mysql.gtid_executed OK
mysql.help_category OK
mysql.help_keyword OK
mysql.help_relation OK
mysql.help_topic OK
mysql.innodb_index_stats OK
mysql.innodb_table_stats OK
mysql.ndb_binlog_index OK
mysql.plugin OK
mysql.proc OK
mysql.procs_priv OK
mysql.proxies_priv OK
mysql.server_cost OK
mysql.servers OK
mysql.slave_master_info OK
mysql.slave_relay_log_info OK
mysql.slave_worker_info OK
mysql.slow_log OK
mysql.tables_priv OK
mysql.time_zone OK
mysql.time_zone_leap_second OK
mysql.time_zone_name OK
mysql.time_zone_transition OK
mysql.time_zone_transition_type OK
mysql.user OK
Upgrading the sys schema.
Checking databases.
sys.sys_config OK
省略...
检查用户数据库及表格
省略...
Upgrade process completed successfully.
Checking if update is needed. #6 检查日志
查看log日志正常。
2 主库5.6从库5.7存在问题
由于从库是5.7版本,mysql、performance、sys等一些系统数据库对象有发生变化,同时一些SQL也有所变动。
2.1 修改用户密码失败
1). 问题
主库修改用户密码,update mysql.user set password=password('newpasswd') where ...
- 2018-03-29T01:22:45.058927Z 12 [ERROR] Slave SQL for channel '': Column 1 of table 'mysql.user' cannot be converted from type 'char(16)' to type 'char(32)', Error_code: 1677
- 2018-03-29T01:22:45.059066Z 12 [ERROR] Error running query, slave SQL thread aborted. Fix the problem, and restart the slave SQL thread with "SLAVE START". We stopped at log 'bin_log.000003' position 3208
2). 分析
修改导致从库复制异常停止,因为 5.6版本mysql.user表格的password字段,在5.7没有该字段,修改为 authentication_string
3). 处理
方案1:事先处理,执行update password 的前,配置会话不记录binlog:set session sql_log_bin=off,然后单独到主从执行该SQL
方案2:事后处理,如果已经出现这个错误,则在从库跳过该sql然后再开启复制同步,最后从库修改密码
- set global sql_slave_skip_counter=1;
- start slave sql_thread;
- show slave status;
- set session sql_log_bin=off;
- alter user suuser@'%' identified by 'newpassword';
- flush privileges;
- set session sql_log_bin=on;
2.2 SQL语法问题
1). 问题
- SELECT字段超过GROUP BY字段报错
- select id,name,age,count(*) from tbuser group by name;
- 其他一些SQL语法问题
2).分析
5.7跟5.6默认的sql_mode配置不一样,如果mysql配置文件中没有说明sql_mode,升级后sql_mode将从NO_ENGINE_SUBSTITUTION修改为ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION,该模式下会导致部分在5.6支持的SQL在5.7报语法错误。
3). 处理
方案1:事先处理,在测试环境中,详细测试程序代码在新版本数据库上的兼容性,若有异常,则修复程序代码中的SQL操作逻辑。
方案2:事先处理,mysql配置文件中,指定sql_mode与5.6版本一致。
方案3:事后处理,如果已经在出现这个错误,有需要快速响应处理,可以把sql_mode修改为跟5.6版本默认的sql_mode一致即可。
3 切换GTID模式
3.1 何为GTID
Global Transaction ID,全局唯一标识,简称GTID,一个GTID 代表在 某个实例上发生的一个事务。
GTID = source_id:transaction_id,其中source_id代表执行该事务的实例的server_uuid,transaction_id是自增值,从1开始,故GTID实际表示为:在 source_id 实例上面发生的 第 transaction_id 个事务。
3.2 GTID相关配置参数
- ENFORCE_GTID_CONSISTENCY
- warn
- 如果出现GTID不兼容的语句用法,在错误日志会记录相关信息,那么需要调整应该程序避免不兼容的写法,直到完全没有产生不兼容的语句,可以通过应该程序去排查所有的sql,也可以设置后观察错误日志一段时间,这一步非常重要。
- on
- 启动强制GTID一致性
- GTID_MODE
- 说明
- OFF
- 新事务是非GTID, Slave只接受不带GTID的事务,传送来GTID的事务会报错
- OFF_PERMISSIVE
- 新事务是非GTID, Slave只接受不带GTID的事务也接受带GTID的事务
- ON_PERMISSIVE
- 新事务是GTID, Slave只接受不带GTID的事务也接受带GTID的事务
- ON
- 新事务是GTID, Slave只接受带GTID的事务
- 切换顺序
- 需要严格按照以下顺序,不可跳跃
- OFF <= => OFF_PERMISSIVE <= => ON_PERMISSIVE <= => ON
3.3 传统复制切换GTID复制
#step 1
#修改 ENFORCE_GTID_CONSISTENCY 为 warn ,运行一段时间,检查错误日志里边是否存在于GTID不兼容的语句用法,并尽快修复
#主从都执行,先后顺序不要求
set @@global.enforce_gtid_consistency=warn; #step 2
#修改 ENFORCE_GTID_CONSISTENCY 为 on ,确定没有不兼容语法后,可以修改为ON
#主从都执行,先后顺序不要求
set @@global.enforce_gtid_consistency=on; #step 3
#设置GTID_MODE为off_permissiv
#主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = OFF_PERMISSIVE; #step 4
#设置GTID_MODE为off_permissiv=on_permissiv
#主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = ON_PERMISSIVE; #step 5
# 检查全部实例 正在进行的匿名交易数目,也就是非GTID事务有没有都传送到从库上了,需要等到这个变量为 0 才是可以进行下面操作
#主从都执行,先后顺序不要求
SHOW STATUS LIKE 'ONGOING_ANONYMOUS_TRANSACTION_COUNT'; #step 6
#检查所有实例上面的slave的非GTID是否都执行完了
show master status;#取file跟pos到从库去执行查看
SELECT MASTER_POS_WAIT('bin_log.000003', 88748605); #返回结果大于等于0则说明事务已经完全复制完成 #step 7
#清理binlog,切换到新的binlog上面
#主从都执行,先后顺序不要求
flush logs; #step8
#启动GTID
#主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = ON; #step 9
#修改cnf文件
#主从都执行,先后顺序不要求
gtid_mode=on
enforce-gtid-consistency=on
binlog_gtid_simple_recovery=1
3.4 GTID复制切换传统复制
#step 1
#停止从库
#所有从库都执行,先后顺序不要求
stop slave; #step 2
#重置chanage master to语句,关闭 master_auto_position
#所有从库都执行,先后顺序不要求
show slave status \G; #取sql_thread的file跟position位置,Relay_Master_Log_File Exec_Master_Log_Pos
change master to master_log_file='mysql-bin.000003',master_log_pos=4563,master_auto_position=0; #step 3
#测试同步是否正常
#主库对数据进行操作,看从库的position有没有变化,同时看数据是否变更 #step 4
#修改GTID_MODE 为 ON_PERMISSIVE
#主从都执行
SET @@GLOBAL.GTID_MODE = ON_PERMISSIVE; #step 5
#修改GTID_MODE 为 OFF_PERMISSIVE
#主从都执行
SET @@GLOBAL.GTID_MODE = OFF_PERMISSIVE; #step 6
#修改GTID_MODE 为 OFF
#主从都执行
SET @@GLOBAL.GTID_MODE = OFF; #step 7
#清理binlog,切换到新的binlog上面
#主从都执行,先后顺序不要求
flush logs; #step8
#禁用GTID,其中enforce-gtid-consistency可以不关闭,还是进行 GTID的一致性检查
#主从都执行,先后顺序不要求
SET @@GLOBAL.GTID_MODE = OFF; #step9
#检验同步情况 #10
#修改cnf文件,注释GTID的参数
#主从都执行,先后顺序不要求
#gtid_mode=on
#enforce-gtid-consistency=on
#binlog_gtid_simple_recovery=1