在实现levelDB挂载成MySQL引擎时,发现在实际存储是key-value格式时候,MySQL的异构数据同步,可以更简单和更通用。
以tair为例,简要描述一下以MySQL为基础的一种方案。
所谓异构数据同步,是指应用只更新MySQL,而由后端的某些机制将这些更新应用到其他数据存储服务上。
1、MySQL-Tair 引擎
a) 使用
b) 说明
这不是一个“存储引擎”,实际上数据存储在tair服务器上。执行insert/update/delete时,只是将对应的动作put /remove到tair服务器。当然这个过程对用户是透明的。
2、MySQL-Tair 引擎怎么用于更新tair数据
首先,数据更新有两种方式,同步更新和异步更新。
a) 异步更新
先说异步更新。这个类似“读binlog来更新数据”的方案。如果使用MySQL-Tair引擎,结构可以如下:
说明:tair表只存在Slave上,与主库上要更新的表同名。
完备性:以现在主库都是row格式的binglog结构为背景,这里Slave上收到的都会是这个更新的完整行信息,从中取出需要的key和value即可。
b) 同步更新
同步更新的意思,是应用端更新MySQL, 在MySQL和tair同时更新完成后,MySQL才返回用户更新成功。
这种模式更像将tair作为MySQL的网络级别缓存服务。当然应用在读取的时候可以绕过MySQL直接访问tair,则只是作为一种更新方案。
这种模式能够让更新后的下一次访问直接命中tair中的缓存数据。异步则无法保证。
结构如下:
说明:这里实体数据表与tair表在同一个数据库,表结构相同,引擎不同。应用还是更新数据表,用触发器触发相同的语句更新tair表。
完备性:同样的,触发器会得到这个更新的新行全值。
3、MySQL同步的优点
这种有以下优势,即使只考虑异步更新模式:
a) 不需要自己模拟一个MySQL的从库、不需要维护连接(MySQL自带)
b) 不需要解析binlog(什么时候binlog切换都要关心,要做的事情太多)
c) 更方便的监控。MySQL现有的监控接口,直接得到tps、延迟时间,同步点。
d) 更方便的管理。如果主库挂了,一个Change master命令即可;想暂时停更新,stop slave、start slave。
e) 更方便的扩展。 直接利用MySQL的级联主从。
当然还有读binlog方案无法实现的同步选择。
4、其他
不限于tair,只是举例。
如果后端是一个可靠存储,如TFS,则可以当作一个存储表来使用,读写都是SQL接口。与直接更新TFS有什么区别?简单说一个,可以直接跟MySQL里的实体表做join。