一、 前言
什么是事务?大家最熟悉的莫过于数据库事务,一大堆SQL操作一个DB,要么同时成功、要么同时失败。(GTS支持ACID,特此公告,不再解释)
什么是分布式事务?一大堆SQL操作N个DB,或者一大堆服务操作1个或多个DB,要么同时成功、要么同时失败。
怎么保证事务?有一个解决办法是“两阶段提交”,一阶段大家先把该做的做了但是不提交,二阶段再一起提交或都不提交。
单机事务到分布式事务的变化?在分布式环境下,所有的状态同步都需要走网络,成本变得非常高。因此做好分布式事务容易,难点在于怎样做的又快又好。
现状?分布式事务是性能杀手,千万不要使用,可以异步做最终一致,既保证性能又保证功能,完美!我们是程序员,不怕实现幂等、不怕实现补偿、不怕逻辑复杂、不怕工作量、不怕人肉、不怕加班。。。
楼主想说:niubility!然而事实的真相是,过度使用事务造成的性能下降的恶果,应该由应用的开发者承担;应用开发者在使用事务的时候,必须考虑到性能问题。然而,作为中间件,必须提供事务机制,而不是因为性能问题,就干脆不提供事务。我们有义务把通用的问题从复杂业务中抽丝剥茧,做成稳定的工具,避免重复造*。更何况,我们只是牺牲了那么一丢丢性能,换来的是不用加班、不用承担故障风险、可以更好的关注业务本身。
二、 GTS来了
进入正题,什么是GTS?GTS是一款高性能、高可靠、接入简单的分布式事务中间件,用于解决分布式环境下的事务一致性问题。该产品支持 DRDS(TDDL)、RDS、Oracle、MySQL、PostgreSQL、H2 等多种数据源,并可以配合使用 EDAS(HSF)、Dubbo 及多种私有 RPC 框架,同时还兼容 MetaQ(MQ) 消息队列等中间件产品,能够轻松实现分布式数据库事务、多库事务、消息事务、服务链路级事务及其各种组合,策略丰富,易用性和性能兼顾。
我们专注于提供易使用、高性能、稳定、可靠的完整的分布式事务解决方案体系。
三、 双11解决了哪些问题
作为双11战场的新兵,我们承担了阿里影业、村淘、菜鸟结算等业务线,以及公有云波司登、慧银等外部用户的双11大促。
GTS承担了保证业务数据一致的责任,并且一般在业务出现异常的时候才发挥作用,把不完整的业务数据回滚到操作之前的状态。这种异常,在业务压力不大的情况下,是低概率事件,而到了双11大促这种业务流量突发的情况下,变成了频发事件。从11.11零点到10分这段时间里,后端通用服务系统均存在不同程度限流的状况,前端业务出现了大量的不完整事务。我相信,使用GTS的产品线都可以爽歪歪、早早洗洗碎了,完全不用担心那些不完整的事务怎么处理。
事实说明,菜鸟结算、阿里影业、村淘的三个业务场景,在双11的前30分钟内,业务回滚超过5%,全天平均回滚超过2%。其他业务线普遍回滚事务超过总量的1%。无一数据不一致!!!
四、 更多的应用场景
(1)解决TDDL分库分表产生的跨数据库事务
60 * 1000) (timeout = |
(2)解决服务化产生的操作多个服务的分布式事务
60 * 1000) (timeout = |
(3)解决异构数据源,包括TDDL、MetaQ、以及其他关系型数据库产品的分布式事务问题;
60 * 1000) (timeout = |
五、 我们的优势
完整的分布式事务解决方案;
高性能、高可靠;
九项发明专利奠定了技术壁垒;
支撑内外近50个用户,经过实际验证。
六、 未来的挑战及我们的目标
提升SQL兼容性
提升用户体验
丰富可接入资源(含nosql类、消息类、rdbms、更多服务框架)
阿里云帮助文档:https://help.aliyun.com/document_detail/43085.html?spm=5176.product29500.6.225.ePTeeW