Oracle OpenWorld2019发布:地表最强运行Oracle数据库环境 Exadata X

点看视频

Exadata X8M是一个革命性的产品, 通过融合前沿软硬件技术,将业务的响应时间降至更低,能够运行关键OLTP业务的同时也接受更加频繁、更加海量的数据实时在线分析和洞察的混合负载。

本次发布Exadata X8M是业界首款融合多种最新技术的数据库运行环境,与以往的Exadata在性能方面和整体硬件方面都有了较大的变化,以下是部分特性:

  • 分布式存储加入 Intel® Optane™ DC Persistent Memory(单存储节点12*128GB=1.5TB容量)

  • 采用100 Gb RDMA Over以太网技术

  • 持久性内存重做日志加速器

  • 性能和配置方面的提升:

  • 1600万 读IO(8K IO) & 可控的延时

  • 560GB/s 扫描分析吞吐能力

01 Persistent Memory持久性内存

在IT系统中缓存无处不在,从硬件级别的CPU L2/L3 cache、存储电池缓存、网卡缓存、内存缓存、闪存缓存到软件级别操作系统缓存、数据库缓存、各种软件堆栈的Buffer缓存,都是为了让应用的响应时间降至更低,避免比DRAM响应速度慢上千倍的硬盘驱动器打交道。

Exadata早已深谙此道,在X2时代就推出了基于Flash卡的闪存,实现冷热数据的分层存储为应用提供延时更低的IO能力,如今Exadata X8M更是在存储服务器上将持久性内存整合到了Flash闪存前端。

Oracle OpenWorld2019发布:地表最强运行Oracle数据库环境 Exadata X

Persistent Memory持久性内存的典型应用场景着重于将其用作闪存的更快替代方案。使用持久性内存需要依赖传统IO协议,这意味着需要OS调用,存储网络消息,处理器上下文切换和中断。这些方法对于现有的存储设备(如磁盘和闪存)是可以接受的,但对持久性内存来说仍然却太慢了。

相比之下,Oracle Exadata X8M直接从数据库使用RDMA访问智能存储服务器中的持久内存,绕过整个操作系统,IO和网络软件堆栈。这可以显着降低延迟并提高吞吐量。使用RDMA绕过软件堆栈还可以释放存储服务器上的CPU资源,以执行更多智能扫描查询以支持分析工作负载。

由于持久性内存位于共享分布式存储cell节点中,因此在Exadata平台上整合的所有数据库都可以获得性能优势。Exadata智能系统软件可自动将最热的数据库数据迁移到持久性内存,同时在闪存和磁盘上保留较冷的数据。此外,Exadata系统软件可自动管理存储在永久存储器中的所有高可用性和冗余数据。而且使用Exadata不需要应用程序更改或管理任务来利用持久性内存,这一切对应用都是透明的。

高性能OLTP应用需要更高的IOPS能力和更低的延迟时间,Exadata X8M提供创纪录的性能,对共享持久内存的直接数据库访问将峰值性能提高到1600万SQL读取IOPS而且延迟只有19微秒,比业界领先的Exadata X8高出2.5倍同时大大减少了关键数据库IO的延迟,比Exadata X8快10倍以上。即使对于每秒需要数百万IOPS的工作负载,也可实现这些超低延迟。

02 RDMA over 以太网 RoCE


RDMA远程直接内存访问能够让计算机无需操作系统或CPU的运算能力即可从远程计算机访问数据,它通过网卡直接读/写内存,无需额外复制或缓冲,使得延迟能够做到非常低同时也不需要依赖额外的硬件。

RDMA通过InfiniBand引入Exadata,是Exadata高性能架构的基础部分。RDMA支持多种独特的Exadata功能,例如Direct-to-Wire协议和Smart Fusion Block Transfer。

RDMA over Converged Ethernet(RoCE)是基于以太网的开源协议,RoCE的协议使InfiniBand RDMA软件能够在以太网上运行。这允许在网络协议栈的上层使用相同的软件,同时通过以太网将InfiniBand数据包作为UDP over IP传输到较低级别。因此所有现有的InfiniBand RDMA优势也可在RoCE上获得。Oracle OpenWorld2019发布:地表最强运行Oracle数据库环境 Exadata X


Exadata RoCE网络结构按类型提供透明的流量优先级,确保最低延迟的关键消息的最佳性能。低延迟消息(如群集心跳,事务提交和缓存融合)不会因吞吐量较高的消息(例如备份,大型报表或批处理作业)而变慢。 

Exadata RoCE网络还通过确保在第一次尝试时传送数据包来优化通信,而无需进行代价较大的重传。Exadata RoCE通过利用RoCE协议来管理流量流来避免数据包丢失,如果接收器的缓冲区已满,则会智能调度请求发送方减速。

通过智能Exadata系统软件19.3.0,Exadata X8M还可以通过立即检测到服务器故障来消除因故障导致的数据库停顿。服务器故障检测通常需要长时间超时,以避免从群集中错误地将服务器驱逐出去,但是很难区分服务器故障和由于CPU繁忙导致的心跳响应缓慢。Exadata X8M即时故障检测不受操作系统或CPU响应时间的影响,因为它使用基于硬件的RDMA快速确认服务器响应。四个RDMA读取跨源/目标端口的所有组合发送到可疑服务器。如果所有四个读取都失败,则服务器将从群集中逐出。如果端口给予响应则表示服务器正常,即使软件运行缓慢 。

Oracle OpenWorld2019发布:地表最强运行Oracle数据库环境 Exadata X

03 持久性内存重做日志提交加速器

数据库持久化通常采用Write-Ahead Log方式来保证数据的一致性,所以重做日志写入的一致低延迟对于OLTP数据库的性能至关重要。只有当持久化重做日志时,才表示事务提交成功,永久写入存储。通过持久性内存重做日志提交加速器,Oracle Database 19c能够使用RDMA直接将重做日志记录放置在多个存储服务器上的持久性内存中(所以小编也建议各位将19c升级工作提上日程)。由于数据库使用RDMA来完成重做日志写操作,因此可以看到最多8倍的重做日志写入。而且重做日志持久性内存在多个存储服务器上,因此可提供弹性。

存储服务器上的持久性内存日志不是数据库的整个重做日志,它只包含最近写入的记录。因此,Exadata X8M上整合的多个数据库都可以共享缓冲池,从而实现具有一致性能的整合。

Oracle OpenWorld2019发布:地表最强运行Oracle数据库环境 Exadata X

与此同时,本次OOW中同时也发布了ZDLRA X8M,同样采用100Gb RoCE架构,专门为海量数据库的高吞吐数据传输提供保障,这对于用户来说选择会更加灵活和安全。


另外,负责Exadata研发的Team名称正式更改为Mission Critical Database Technologies,充分展示了Oracle对关健业务系统的支撑力度和强大自信。



上一篇:linux – infiniband rdma差转转bw


下一篇:两个presentation