全闪存数据中心是什么样子的?

随着技术的进步和存储介质的成本不断降低,全闪存数据中心的概念也历经了多年的演变。结果就是,几乎每一家全闪存存储厂商都宣布,他们已经推出“实际成本”和基于硬盘的存储系统相当的闪存存储产品。

如果你选择相信厂商们宣称的硬盘成本对比逻辑并推而广之,结论就会是:任何组织都没有理由拒绝全闪存存储。想象一下,一个能瞬间响应每个IO请求的数据中心,而且完全无需区分数据类型!数据管理和性能优化的难题将一扫而光!全闪存存储系统的未来一片光明!总的来说,闪存介质的每GB成本持续走低,同时,管理这些存储系统的软件技术也提供越来越高的可靠性。存储系统软件也在演变,利用更多线程充分发挥多核处理器的性能,以更经济高效的途径解放闪存的性能。

全闪存数据中心的障碍

在现实中,任何关于价格的考虑都会成为建设单一闪存层的障碍。首先,厂商只会把价格和高性能的硬盘系统作对比,而不是和更具性价比的大容量系统对比。其次,大多数全闪存厂商都针对块级数据设计他们的存储阵列。某些产品会整合NAS功能,也有产品会整合对象存储,迅速成为存储由计算机生成的非结构化数据的新选择。虽然也有例外,但是通常情况下,大部分非结构化数据使用场景并不能充分利用闪存性能。闪存几乎总是数据块存储的最优选择,却并不总是适合NAS或对象类型存储,对后者而言硬盘驱动器往往是更好的高性价比之选。第三,即使是闪存存储,也有多种不同的闪存介质,分别适合不同的使用场景。

然后是数据。即使组织不断产生和存储越来越多的数据,然而在数据的最初创建和修改阶段过后,实际上大多数数据永远都不会被再次访问。但是无论如何,我们还是必须要保留这些数据“以防万一”。如果没有更便宜的选择,用闪存来保管全部数据也并无不妥。只要确保“万一”的状况真的发生时,数据能够立即可用就行。

问题在于,即使全闪存数据中心的拥护者也无法否认有更便宜的替代方案,具体来说有三种:磁带,大容量硬盘和云。这些方案都有其缺点:磁带的使用成本并不低,云会引入新的安全问题,并且如何将数据从全闪存存储层迁移到这些目标存储也是管理上的难题。但毫无疑问,将旧数据迁移到旧的低速存储层肯定可以节省成本。

这就又把我们带回最初的问题:“多少闪存才算够用?”答案是——对于IT团队而言——总是要看情况再说。通常,只要能找到便宜的替代品就尽量少用闪存。要真正实现这些节省,你还需要设法驱动数据在高性能存储和廉价存储之间尽可能平滑地迁移。如果数据透明迁移无法实现,那么部署一套廉价存储层节省的钱就会很快变得毫无意义。

这也意味着,你的数据迁移策略的有效性将成为全闪存数据中心的决定因素。

高效的数据迁移策略

将非活动数据从昂贵的存储层移动到相对便宜的存储层,这种想法从几十年前就已经存在了。问题在于,过去的大多数数据迁移方法都极其繁琐,并且IT专业人员认为管理这些数据的投入和收益不成比例。但情况在最近这几年有了改变,在存储层之间迁移数据已经司空见惯,非常容易实现和管理。

简化数据迁移的第一步就是:引入混合存储系统。这类存储系统会在系统内部移动数据,典型的操作就是把数据从小容量的闪存层移动到大容量的硬盘层。有意思的是,大多数混合存储厂商现在也提供全闪存产品,并且都声称他们的全闪存存储销量超过混合存储系统。

某些厂商指出,他们的全闪存储产品卖得比混合存储系统好,印证了全闪数据中心的转型趋势。由于混合存储系统适合许多环境,全闪存就显得更有吸引力。混合存储的挑战是,必须能按需同时提供全闪存的性能和硬盘存储的性能。由于混合存储系统内部架构(计算、内存、网络)必须和高性能的闪存配套,这些高速内部组件的成本必然超过那些只需要对付硬盘性能的普通存储阵列。

某些更前卫的全闪存存储厂商会宣称,为了满足高性能、在线或近线数据等多种需求,完全使用闪存的系统才是优选。未来的混合存储系统将管理不同类型的闪存,而不只是管理闪存和硬盘。

尽管仍有关于冷数据的争议,但一定会有更经济的办法去存储这些数据。一套存储系统混用各种阵列努力实现更好看每GB成本指标,这就催生了一套专门的技术体系。数据中心必须拥有一套策略驱动机制,基于策略在不同类型的存储系统之间移动数据。好消息是,已经有大量实现这些策略的软件涌现。

硬件无关的数据迁移

硬件无关的数据迁移有多种实现方式。第一种就是全局文件系统。这是一类跨越多个物理存储硬件的分布式文件系统,基于策略在节点之间移动数据。能充当全局文件系统节点的硬件类型几乎没有限制,大多数支持在闪存和磁盘系统之间移动数据,某些支持将数据移动到云(私有或公有云),甚至支持移动到磁带介质。由于全局文件系统是增强版的文件系统,他们对NFS或者SMB挂载方式的支持有一些限制。要实现支持,所有充当全局文件系统节点的存储硬件都必须具备创建NFS或者SMB共享资源的能力。

和全局文件系统不同的是,某些公司开发了一类新的硬件无关数据移动方式,例如 Primary Data、ioFabric 和Strongbox。他们的软件不要求所有数据都位于共享文件夹,也不要求所有节点存储硬件提供NFS或者SMB共享资源。有些产品甚至能聚合块级存储或对象存储系统资源,并实现这些系统之间的数据移动。

针对容量和性能场景,硬件无关的数据迁移技术让你可以用较低的成本部署全闪存阵列,提升活动数据的性能;同时使用容量优先的存储系统承载非活动数据。这些技术会依照组织创建的策略在不同的系统负载之间透明地移动数据,最常见的策略就是“如果数据在规定的天数内没有访问记录,则把该数据从闪存阵列移动到大容量存储”。

结果就是,满足(少量)活动数据性能要求的全闪存阵列成本与硬盘阵列相当,而且非活动数据仍然可以使用廉价的替代存储。在提供相同容量的情况下,高容量硬盘阵列、对象存储、公共云存储,甚至磁带的平均价格都比闪存阵列更低。全闪存数据中心更加需要用心决策哪些数据应该驻留在何处,以及如何将这些数据移动到昂贵的闪存之外的、遍布数据中心内的替代存储。基于这一立场,你就无法忽略大容量存储产品的性价比,更何况向这些存储无缝迁移数据已经极其容易。

所以,大多数数据中心会针对最活跃和次活跃的数据配置最多相当于总容量20%的全闪存阵列。数据中心另外80%的存储容量则采用侧重容量的存储——高容量NAS、对象存储或公共云存储。

严格说来,所谓全闪存数据中心应该叫做“五分之一闪存”数据中心才对。

本文转自d1net(转载)

上一篇:python测试之mock


下一篇:Commvault联手Pure Storage与思科打造闪存数据中心