企业级分布式 HTAP 数据库管理系统 TBase

TBase 是腾讯数据平台团队在开源的 PostgreSQL 基础上研发的企业级分布式 HTAP 数据库管理系统:

  • 具备高性能可扩展的分布式事务能力,支持 RC 和 RR 两种隔离级别;

  • 通过安全、管理、审计三权分立体系,提供全方位的数据安全保证机制;

  • 支持高性能分区表,可使得数据检索效率成倍提升;

  • SQL 方面兼容 2003 标准、PostgreSQL 语法和常用 Oracle 函数&数据类型、窗口函数等;

  • 提供大小商户数据分离、冷热数据分离等高效的数据治理能力

TBase 架构:

企业级分布式 HTAP 数据库管理系统 TBase

集群中有三种节点类型,各自承担不同的功能,通过网络连接成为一个系统。这三种节点类型分别是:

  • Coordinator:协调节点,对外提供接口,负责数据的分发和查询规划,多个节点位置对等,每个节点都提供相同的数据库视图,CN 存储系统的全局元数据。

  • Datanode:处理存储本节点相关的元数据,每个节点还存储数据的一个分片。在功能上,DN 节点负责完成执行协调节点分发的执行请求。

  • GTM: 全局事务管理器(Global transaction manager.),负责管理集群事务信息,同时管理集群的全局对象,比如序列,除此之外 GTM 上不提供其他的功能。

TBase 功能介绍:

  • 分布式事务全局一致性能力:通过拥有自主专利的分布式事务一致性技术,包括两阶段提交(Two Phase Commit)以及全局时钟(Global Timestamp)的策略来保证在全分布式环境下的事务一致性。

  • SQL兼容能力:SQL2003 标准、PostgreSQL 语法、常用 Oracle 函数&数据类型、UDF/UDAF、常见窗口函数、JSON/JSONB/XML/数组等多种 NoSQL 类型 、递归 WITH、无锁 DDL 操作、扩展插件等。

  • HTAP能力:提供 OLTP 以及 OLAP 两个平面视角 ,OLTP 业务运行在 datanode 主节点上,OLAP 业务运行在 datanode 节点的备节点上,揭秘提升网站权重二者的数据同步采用流复制的方式来进行。

  • 读写分离能力:提供了读写和只读两个平面视角,读写流量请求由主节点来处理,只读流量请求由备节点来处理,主备节点的数据同步采用流复制的方式来进行。

  • 卓越的数据安全保障能力:通过三权分立的体系,将传统数据库系统 DBA 的角色分解为三个相互独立的角色:安全管理员、审计管理员、数据管理员;基于此提出安全策略,主要细分为三个部分:数据加密、数据脱敏访问、强制访问控制,三者组合提供多个层级的数据安全保障能力。

企业级分布式 HTAP 数据库管理系统 TBase

  • 高效的数据治理能力:数据倾斜治理,用以解决数据分布不均带来的存储以及性能压力;冷热数据分级存储 ,用以降低业务的存储成本、提升热数据的性能。

  • 多核并行计算能力:节点内部采用了并行计算,根据表大小同时启动多个进程来协同完成一个查询。

  • 多租户能力:基于节点组 node group 的集群内多租户解决方案,做到数据库集群内部的业务和资源隔离,多个业务在TBase内部相互隔离的运行。

  • 多级容灾能力:采用强同步复制来保证主从数据完全一致,保障主节点故障时数据无丢失;提供基于任意时间点的恢复特性来防止误操作带来的数据丢失。

  • 在线扩容能力:通过引入shard map层(shard map 中每一项存储 shardid 和 DN 的 映射关系 ), 在新加节点时,只需要把一些 shard map 中的 shardid 映射到新加的节点,并把对应的数据搬迁过去就可以了,大大缩短扩容时间。

  • 丰富的周边生态能力:PostGIS、异构数据复制、LVS 负载均衡、FDW 联邦能力等。

 TBase 适用场景:

  • 在国产化落地、业务核心领域去 O 场景;

  • 对 HTAP 混合事务分析应用模型有需要的业务场景;

  • 对物联网地理信息系统有需求的业务场景;

  • 对实时高并发环境下的分布式事务强一致性有要求的业务(如金融、证券等业务)场景;

  • 对企业级数据安全、审计、治理应用相关功能有需求的业务场景;

  • 对高可用、异地容灾、7*24 小时服务能力有需求的业务场景;

  • 有海量存储计算需求、弹性扩容、在线扩容需求的业务场景;

  • 对异构数据互通共享有需求的业务场景。

上一篇:【SequoiaDB|巨杉数据库】HTAP混合负载Ⅱ


下一篇:混合事务分析处理“HTAP”的技术要点分析