新一代服务器预览:M.2 SSD系统盘RAID1方案

正如我在《DellEMC World 2017(1)25GEFC多协议交换机和SC5020》中所说,由于下一代的Intel XeonProcessor ScalableXeon SPCPU还没有正式发布,因此各厂商的服务器新品也无法大规模宣传。但这无法阻止与处理器/芯片组不直接相关的特性提前“偷跑”,比如Dell PowerEdge 14GBoot Optimized Storage Solution (BOSS,不是那个老板的意思)

 

本文参考了Dell TechCenter公布的一份白皮书——《Direct from Development -PowerEdge Boot Optimized Storage Solution (BOSS)》,结尾处会列出下载地址。

 

为什么是M.2 SATA而不是NVMe SSD

 

就像《下一代Xeon E5服务器抢先看:NVMeFPGA爆发》标题中写的那样,人们都在盼望着更多的NVMe支持,U.2M.2,而这里出现的却不是NVMe

 

新一代服务器预览:M.2 SSD系统盘RAID1方案


简单来说,Boot Optimized Storage Solution是一块安装在PCIe槽位的扩展卡,上面可以有1-2M.22280SATA SSD,用于系统盘并支持RAID 1。可以节约额外的2.5英寸驱动器槽位。

 

许多朋友应该都知道M.2 SSD外形可以做成NVMe或者SATA两种接口协议,通常前者性能较高。那么崇尚参数的人可能要开喷了?别着急:)我们先来看看这样做的目的是什么,或者说如果你是产品经理会怎么选?

 

新一代服务器预览:M.2 SSD系统盘RAID1方案NVMe SSD有许多优点,但是只用于系统盘呢?

 

1、  这里的M.2设备是读密集型(Boot Class120GB/240GB,与2.5英寸SATA SSD相同的成本和性能。目的很明确——就是用于系统盘,而且SSD在此处替代HDD机械硬盘已经渐成趋势,无论从功耗还是故障率来看。

 

新一代服务器预览:M.2 SSD系统盘RAID1方案

上面照片拍摄于PowerEdge 12G发布会,如今在服务器机箱后端提供22.5英寸盘位已经比较多见。由于SSD没有机械部件故障率降低,RAID1保证可靠性却不急于换盘;还有些用户不做RAID系统盘热插拔的需求不再明显。当然节约空间的M.2也适合固定在机箱里。

 

扩展阅读:M.2SSD热插拔:Facebook和微软的两种方案

 

2、  固定功能硬RAID 1(镜像)或者Pass-Through直通。双口SATA硬件RAID控制芯片,合并2SSD和控制芯片到单一PCIe适配卡上。由于只是RAID1,应该不需要NVRAM那些复杂的设计,但是OS兼容性比较重要

 

我们知道对于NVMe来说硬RAID卡一直是个难题,关注企业存储技术微信公众号时间长的朋友可能看过我写的《首款SAS_SATA_PCIe三模RAID发布:ARM替代PowerPC》。如今BroadcomAvago)网站上对应的RAID/HBA卡资料也有了,但是性能(特别是写IOPS)似乎还是比较敏感的数字。另外,如果只用于OS启动盘,专门配这种级别的RAID卡成本上也不划算。

 

在不做RAID的情况下,单系统盘NVMe引导的兼容性也没有传统SATA好,至少要使用UEFI

 

3Boot OptimizedStorage Solution的管理可以通过标准化、人们熟知的工具,包括OpenManage Systems AdministratorOMSA)和命令行界面(CLI

 

DellBOSS方案的官方评价是:灵活、冗余、低成本的启动优化解决方案,因为它的目标就是替代2.5SATA SSD系统盘,以及对SAS RAID卡连接能力的占用。

 

Dual SD Module有何异同?

 

熟悉Dell服务器的朋友应该知道,PowerEdge还有一种操作系统部署位置选择——Dell Internal Dual SD ModuleIDSDM),我们习惯把它叫做SD模块

 

新一代服务器预览:M.2 SSD系统盘RAID1方案


SDMicroSDTF)存储卡占用的空间显然更小,Dual SD Module目前常见的16GB32GB容量比较适合于安装VMware HypervisorESXi,下文中还会谈及)。但我们也注意到该方案存在的一些限制:除了容量之外,包括性能和闪存的寿命与SSD有差距,对于一部分Windows或者Linux系统盘就不见得合适了。

 

对超融合(HCI)、软件定义存储(SDS)的意义

 

下面我从VMware工程师苏旭的文章《vSAN推荐的IO控制器的配置方式》中引用了一张图。

 

新一代服务器预览:M.2 SSD系统盘RAID1方案


在以上6种方案中,“VMware极力推荐并支持Solution4,如果服务器是R730xd支持Solution 3不支持Solution 1Solution 2VMware不推荐Solution 5Solution 6。注意不推荐的原因是ESXi属于单点,但仍可使用,出问题VMware也是支持的。

 

Dell H730系列RAID卡属于PERC9家族,支持Pass-Through直通即HBA模式,并支持一部分RAID另一部分盘直通的配置。但《vSAN_6.0设计和优化指南》明确指出过:不要为vSAN和非 vSAN 磁盘混合使用不同的控制器模式,这就好像Oracle官方不认证OVM以外x86虚拟机环境。当然还有更“霸道”一点的,比如Windows Server 2016自带的分布式存储Storage Spaces DirectS2DRAID卡(比如H730H330完全设置为HBA都不允许,只能用HBA330这样的卡。

 

扩展阅读:《微软WS2016原生分布式存储:还在追赶VSAN

AzureStack中的超融合存储-S2D进阶篇

 

一些存储软件喜欢直接控制到底层磁盘/SSD,不希望RAID卡在中间中再做个单盘RAID 0啥的。我们看到Solution 3就是用H730 Mini专门做HypervisorRAID 1,另外一块H730P配置为HBA模式给vSAN直通用。前提是PowerEdge R730xd的背板支持Split拆分模式,但H730 Mini这样用多少感觉有点浪费?

 

Solution 46中的Dual SD Module有一点注意事项——“需要手动指定LOG 存储的永久位置,不要把主机的日志输出指向vSANDatastore”,如果是硬盘/SSD安装ESXi日志则可以直接放本地。至于SATA DOM,在服务器大厂的推荐配置中出现的不太多,其供应来源和质量容易出现一些问题。特别是小容量的SATA DOM盘,如果存储软件需要频繁修改根盘上的元数据/Super block之类的,一般用于制造U盘的消费级MLCTLC闪存颗粒很容易用坏。相比之下,120GB/240GB入门级数据中心SSD的表现就要好很多了。

 

综上所述,PowerEdge 14G服务器的Boot Optimized Storage Solution,双M.2 SSD用于vSAN、微软S2DScaleIO或者Ceph存储软件的系统盘,应该都是很合适的。

 

先写到这里吧,距离Xeon SP服务器新品发布还有一段时间,我如果看到什么好东西再跟大家分享。

 

参考资料

http://en.community.dell.com/techcenter/extras/m/white_papers/20444059/download
上一篇:每一种SDS都能做超融合吗?


下一篇:Xeon SP服务器新技术:防代码入侵从BIOS做起