正如我在《DellEMC World 2017(1):25GE、FC多协议交换机和SC5020》中所说,由于下一代的Intel XeonProcessor Scalable(Xeon SP)CPU还没有正式发布,因此各厂商的服务器新品也无法大规模宣传。但这无法阻止与处理器/芯片组不直接相关的特性提前“偷跑”,比如Dell PowerEdge 14G的Boot Optimized Storage Solution (BOSS,不是那个老板的意思)。
本文参考了Dell TechCenter公布的一份白皮书——《Direct from Development -PowerEdge Boot Optimized Storage Solution (BOSS)》,结尾处会列出下载地址。
为什么是M.2 SATA而不是NVMe SSD?
就像《下一代Xeon E5服务器抢先看:NVMe、FPGA爆发》标题中写的那样,人们都在盼望着更多的NVMe支持,U.2和M.2,而这里出现的却不是NVMe。
简单来说,Boot Optimized Storage Solution是一块安装在PCIe槽位的扩展卡,上面可以有1-2个M.2(2280)SATA SSD,用于系统盘并支持RAID 1。可以节约额外的2.5英寸驱动器槽位。
许多朋友应该都知道M.2 SSD外形可以做成NVMe或者SATA两种接口协议,通常前者性能较高。那么崇尚参数的人可能要开喷了?别着急:)我们先来看看这样做的目的是什么,或者说如果你是产品经理会怎么选?
NVMe SSD有许多优点,但是只用于系统盘呢?
1、 这里的M.2设备是读密集型(Boot Class)120GB/240GB,与2.5英寸SATA SSD相同的成本和性能。目的很明确——就是用于系统盘,而且SSD在此处替代HDD机械硬盘已经渐成趋势,无论从功耗还是故障率来看。
上面照片拍摄于PowerEdge 12G发布会,如今在服务器机箱后端提供2个2.5英寸盘位已经比较多见。由于SSD没有机械部件故障率降低,RAID1保证可靠性却不急于换盘;还有些用户不做RAID,系统盘热插拔的需求不再明显。当然节约空间的M.2也适合固定在机箱里。
扩展阅读:《M.2SSD热插拔:Facebook和微软的两种方案》
2、 固定功能硬RAID 1(镜像)或者Pass-Through直通。双口SATA硬件RAID控制芯片,合并2个SSD和控制芯片到单一PCIe适配卡上。由于只是RAID1,应该不需要NVRAM那些复杂的设计,但是OS兼容性比较重要。
我们知道对于NVMe来说硬RAID卡一直是个难题,关注企业存储技术微信公众号时间长的朋友可能看过我写的《首款SAS_SATA_PCIe三模RAID发布:ARM替代PowerPC》。如今Broadcom(Avago)网站上对应的RAID/HBA卡资料也有了,但是性能(特别是写IOPS)似乎还是比较敏感的数字。另外,如果只用于OS启动盘,专门配这种级别的RAID卡成本上也不划算。
在不做RAID的情况下,单系统盘NVMe引导的兼容性也没有传统SATA好,至少要使用UEFI。
3、Boot OptimizedStorage Solution的管理可以通过标准化、人们熟知的工具,包括OpenManage Systems Administrator(OMSA)和命令行界面(CLI)
Dell对BOSS方案的官方评价是:灵活、冗余、低成本的启动优化解决方案,因为它的目标就是替代2.5寸SATA SSD系统盘,以及对SAS RAID卡连接能力的占用。
与Dual SD Module有何异同?
熟悉Dell服务器的朋友应该知道,PowerEdge还有一种操作系统部署位置选择——Dell Internal Dual SD Module(IDSDM),我们习惯把它叫做双SD模块。
SD和MicroSD(TF)存储卡占用的空间显然更小,Dual SD Module目前常见的16GB、32GB容量比较适合于安装VMware Hypervisor(ESXi,下文中还会谈及)。但我们也注意到该方案存在的一些限制:除了容量之外,包括性能和闪存的寿命与SSD有差距,对于一部分Windows或者Linux系统盘就不见得合适了。
对超融合(HCI)、软件定义存储(SDS)的意义
下面我从VMware工程师苏旭的文章《vSAN推荐的IO控制器的配置方式》中引用了一张图。
在以上6种方案中,“VMware极力推荐并支持Solution4,如果服务器是R730xd,支持Solution 3;不支持Solution 1和Solution 2;VMware不推荐Solution 5和Solution 6。注意不推荐的原因是ESXi属于单点,但仍可使用,出问题VMware也是支持的。”
Dell H730系列RAID卡属于PERC9家族,支持Pass-Through直通即HBA模式,并支持一部分RAID另一部分盘直通的配置。但《vSAN_6.0设计和优化指南》明确指出过:不要为vSAN和非 vSAN 磁盘混合使用不同的控制器模式,这就好像Oracle官方不认证OVM以外x86虚拟机环境。当然还有更“霸道”一点的,比如Windows Server 2016自带的分布式存储Storage Spaces Direct(S2D),RAID卡(比如H730、H330)完全设置为HBA都不允许,只能用HBA330这样的卡。
扩展阅读:《微软WS2016原生分布式存储:还在追赶VSAN?》
一些存储软件喜欢直接控制到底层磁盘/SSD,不希望RAID卡在中间中再做个单盘RAID 0啥的。我们看到Solution 3就是用H730 Mini专门做Hypervisor的RAID 1,另外一块H730P配置为HBA模式给vSAN直通用。前提是PowerEdge R730xd的背板支持Split拆分模式,但H730 Mini这样用多少感觉有点浪费?
在Solution 4和6中的Dual SD Module有一点注意事项——“需要手动指定LOG 存储的永久位置,不要把主机的日志输出指向vSANDatastore”,如果是硬盘/SSD安装ESXi日志则可以直接放本地。至于SATA DOM,在服务器大厂的推荐配置中出现的不太多,其供应来源和质量容易出现一些问题。特别是小容量的SATA DOM盘,如果存储软件需要频繁修改根盘上的元数据/Super block之类的,一般用于制造U盘的消费级MLC、TLC闪存颗粒很容易用坏。相比之下,120GB/240GB入门级数据中心SSD的表现就要好很多了。
综上所述,PowerEdge 14G服务器的Boot Optimized Storage Solution,双M.2 SSD用于vSAN、微软S2D、ScaleIO或者Ceph存储软件的系统盘,应该都是很合适的。
先写到这里吧,距离Xeon SP服务器新品发布还有一段时间,我如果看到什么好东西再跟大家分享。
参考资料
http://en.community.dell.com/techcenter/extras/m/white_papers/20444059/download