企业存储的灵丹妙药是什么?这个“东西”能够影响到数据中心存储系统里的每个硬件和软件。这个终极的发现不仅仅局限在存储领域,而是对整个不断吞吐着数据的IT领域和所有的业务流程。
你也许会说,超融合基础设施(HCI)?有趣的回答,但这不过是数据中心这艘巨舰甲板的一种改进罢了。软件定义存储(SDS)?不,SDS看起来更像是一个关注点的转移,即不再强调硬件比任何其它东西更重要(但它主要还是由硬件供应商在销售,对吧?)。云存储? 算了吧,那不过是换了个地方存放你的数据。对象存储,这个正当红的存储阵列技术?
嗯,你越来越接近答案了。对象存储最酷的一点就是它支持扩展元数据的能力,而元数据是数据分类的基础。数据分类正是存储的终极灵药。
被忽视多年的数据分类
是的,是的,我承认我已经在好几个场合提到过数据分类这个话题,但要说服人们(和存储供应商)存储的革新不仅仅只是高性能闪存和大容量驱动器真的是不容易。如果你对正在读写的数据一无所知的话,那么延迟、吞吐量、IOPS,这一切都不重要了。
虽然数据分类的重要性得到了业界公认,但几十年来,大多数存储厂商对此所取得的进展寥寥,有的也只是些事后添加的小东西。这的确不太公平。还记得信息生命周期管理(ILM)吗?ILM致力于解决数据混乱无序的顽疾,但没过许久ILM便成了存储界的死亡之吻。让我们回到石器时代,当大型机充斥着世界,分层存储管理(HSM)曾是数据分类和管理的方法。但随着“新”存储架构和基础设施的出现,业界开始为满足容量、数据处理和保护的需求而孜孜不倦之后,所有这一切都被无情抛弃进了IT的垃圾堆。
但这实际上使数据得到了最好的保护,也使得我们现在做所有这些事情都更容易、更便宜,也做得更好。
从知道是什么到知道该做什么
还不够信服?让我们做个类比。假如你要对那个独立大壁橱进行一次春季大扫除,那里放着很多看起来不应该放在那里的东西。在打理这堆杂乱物件时,你在断了线的网球拍后边发现了一些东西。你接下来该对它们做什么?此时,你不知道要做什么,当然,因为我还没有告诉你那是什么“东西”。
它可能是从挂在上面的外套上松脱的一个按钮,或者是2009年VMworld大会的与会者徽章,抑或是一个已经丢失很久的彩票。你可能会把钮扣重新缝在外套上,丢掉那个徽章或者查看一下你是否是个获奖者,或者应该在法国南部购置不动产而不是在读我这篇文章。
事情就是这样,如果你知道是什么,你就会知道要做什么。数据也一样。
数据分类很关键,但还不是万能灵药
将数据分类,以便你知道一些关于它的基本事实,例如文件内有什么,为什么创建它,谁创建的,谁应该能看到它谁不应该等等,这一批不小的信息决定了数据该如何被处理和存放。如果它是公司的重要信息,你可能需要多次备份,加密并设置访问权限。如果它是公司圣诞派对的计划,可能就不需要太严格的措施。相比当前大多数文件系统所能提供关于某文件的相关信息,的确会让你茫然不知道该做什么。
信息生命周期管理之所以失败是因为它是一个额外步骤,事实上,是很多额外的步骤,需要大量的手动干预和关注。将数据分类这样的操作留给人类自己来完成,这样的设计注定要失败。但是如果能根据创建文件的应用程序,使用应用程序的人、该人所属的组、文件始发者的安全等级等一系列要素对分类进程自动化,则文件本身就包含了对它们进行下一步处置的的关键信息。
在以数据为中心的世界里,数据应该会说话。“对不起,你不能把我复制到云...嘿,是时候该把我做下归档了。 ...不,不要把我加到电子邮件附件里。”
大多数存储仍然不够聪明
当你考虑可靠的数据分类方法能够用于多少应用场景时,你可能会惊奇地发现,主要的存储供应商竟然都没有在这一领域发力。这也许并不奇怪,因为存储供应商们实际上很少把这些功能加到他们的产品里。然而,合规性、安全性和其他产品类别的供应商会以其他形式和格式提供这样的技术。
例如,我看过一个非常有用的文档,由数据安全供应商Digital Guardian发布的“数据分类权威指南”。是的,数据分类也是有效保护数据的关键。
虽然还有其它备选方案,但把所有数据分类的鸡蛋都放在一个供应商的篮子里,从而导致厂商锁定的问题还是带来了一些阻力。也许随着对象存储的风靡和更广泛的实现,它将激发存储供应商对元数据进行一定程度的标准化。这样一来,应用程序、操作系统和文件系统只需要一个简单的词汇表就能恰当地进行分类数据了。
本文转自d1net(转载)