MySQL HA方案之MySQL半复制+MHA+Keepalived+Atlas+LVS[转]

2021-07-27 23:37:31

MySQL HA方案之MySQL半复制+MHA+Keepalived+Atlas+LVS

简介

目前Mysql高可用的方案有好多，比如MMM，heartbeat+drbd，Cluster等，还有percona的Galera Cluster等。这些高可用软件各有优劣。在进行高可用方案选择时，主要是看业务还有对数据一致性方面的要求。本文探讨的是MHA这种方案。

至于DAL层，也有很多方案，现在主流的一是在应用层写数据库路由，当然这个效率也是最快的，但是最大的缺陷就是运维难度大，技术难度也大，需要有强大的技术团队支持。第二个方案是proxy中间件，现在开源的中间件很多，比如TDDL、Cobar、Atlas、MyCat、Mysql Proxy、Oceanus等等，中间件的最大的好处是对数据层解耦，减轻了运维难度，当然在服务器层与数据库层加了一层proxy，使得效率明显不如直接访问数据库。按业务实际需求选择合适的方案，在本篇文章中，选的是360开源的DAL中间件Atlas，详细信息官方文档（https://github.com/Qihoo360/Atlas）以描述的很清楚，这里不做过多的描述。

现在继续讨论MHA，MHA（Master High Availability）目前在MySQL高可用方面是一个相对成熟的解决方案，它由日本DeNA公司youshimaton（现就职于 Facebook公司）开发，是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中，MHA能做到在 0~30秒之内自动完成数据库的故障切换操作，并且在进行故障切换的过程中，MHA能在最大程度上保证数据的一致性，以达到真正意义上的高可用。

该软件由两部分组成：MHA Manager（管理节点）和MHA Node（数据节点）。MHA Manager可以单独部署在一*立的机器上管理多个master-slave集群，也可以部署在一台slave节点上。MHA Node运行在每台MySQL服务器上，MHA Manager会定时探测集群中的master节点，当master出现故障时，它可以自动将最新数据的slave提升为新的master，然后将所有其他的slave重新指向新的master。整个故障转移过程对应用程序完全透明。

在MHA自动故障切换过程中，MHA试图从宕机的主服务器上保存二进制日志，最大程度的保证数据的不丢失，但这并不总是可行的。例如，如果主服务器硬件故障或无法通过ssh访问，MHA没法保存二进制日志，只进行故障转移而丢失了最新的数据。使用MySQL 5.5的半同步复制，可以大大降低数据丢失的风险。MHA可以与半同步复制结合起来。如果只有一个slave已经收到了最新的二进制日志，MHA可以将最新的二进制日志应用于其他所有的slave服务器上，因此可以保证所有节点的数据一致性。

我们自己使用其实也可以使用1主1从，但是master主机宕机后无法切换，以及无法补全binlog。master的mysqld进程crash后，还是可以切换成功，以及补全binlog的。

架构图

现在说下架构图的层级关系，最底层的是mysql主从，其中有从机作为备选的主机，备选主机与主机之间由keepalived维护着心跳。每个mysql server都是MHA node，由MHA Manager监控着Mysql的节点，当MHA Manager监控（keepalived的心跳检测）到主机出现问题，会切换到备选主机，并将备选主机提升为新主机，其他的从机成为新主机的从机，并且 VIP也漂移到新主机，这样就实现了Mysql的HA。db上面的一层是Atlas Proxy，Atlas主要的功能是读写分离、从库的负载均衡、自动分表、自动摘除宕机的DB、DBA可平滑的上下线DB及IP过滤，其中读写分离及自动摘除宕机的DB是当初选择该中间件的最主要原因，自动摘除宕机的从机保障了整个架构系统持续性，而不影响业务的正常运行。后期根据数据量的增大可以切换到 Mycat这个方案，支持分库分表、主从切换等等，并且社区活跃度也很高，感兴趣的可以查看下官方文档（https://github.com /MyCATApache）。回到正题，这里有两个Atlas做HA，上层的LVS做Atlas的负载均衡，两个LVS之间利用keepalived心跳实现热主备模式，防止出现单点故障。再上层的就是应用server，这里就不在讨论了。

码农公寓

MySQL HA方案之MySQL半复制+MHA+Keepalived+Atlas+LVS

简介

架构图

相关文章