DCIM系统可以基础也可以很庞大。无论哪种方式,当今的数据中心都不能没有它。
即使在组织选择了一款数据中心基础设施管理(DCIM)工具后,依然存在大量问题。事实上,问题会比选定并使用一款产品之前还要多。
判断DCIM软件是否能够达成预期并不容易,或者它是否会提供你需要的信息,而不是大量你无法阅读或使用的数据。这中间会存在问题、意外和复杂性。
罗马不是一天建成的
DCIM术语在业内流行了多年,但更有趣的是它目前仍然不能被精确定义。没有什么可靠的方法来定义什么是好的DCIM,没有简单方法来确定何种方式最适合你的运营,也没有公式来计算需要多少资源来运作整套系统。
一般情况下,DCIM被视为IT与建筑设施功能的组织聚合。目标是提供管理员完整全面的数据中心性能检查,确保能耗、设备和建筑面积的最佳使用效率。有些组织宣称他们已经通过DCIM实现巨大的成功。有些则在某种程度上后悔入坑,发现他们在没有足够的认识之前就采取了*的尝试。
最全面的DCIM包允许你从相对小规模开始实施——比如说攻功率测量与电力使用率跟踪——然后再模块化添加功能,让用户更容易使用这些信息。需要时间与经验的积累,才能知晓哪些功能是最有用的,所以一口气购买全套功能的想法,不是一个好方案。
请记住DCIM不会回答所有问题,甚至有时候可能增加困难。例如,查看温度与湿度这个基本功能。增加对冷却设备的能力监控来预测潜在问题时十分有价值的,但却是一个实现起来复杂的功能。
战略上,安装传感器是比较容易的方案,尤其随着无线技术的发展与应用。测量水流量、流体压力、泵振动和其他机械参数要求关闭设备并对繁中工作进行整合。即使是通过IP连接空调,把大量数据传输到目标结点的任务也是十分艰巨的。
大部分数据是厂商用于性能跟踪和故障分析使用,而且每个设备都以自己的格式传输信息。DCIM系统需要解析数据,并将其与其余的机械应用链集成,以提供有用的信息。最全面的软件方案,应该提供预先编写的软件模块,采集空调机房单元与机房空气处理器数据,但这需要大量的自定义配置。不仅如此,拥有一个监控机械异常的系统,并且在故障发生前提醒你,是非常有价值的,尤其是没有冗余设备支持运作的低级数据中心设施。
设备跟踪在一个关注能源与冷却管理的系统中似乎没有意义,但这确是DCIM软件功能中有用的一部分。设备的部署需要工作人员花时间实现,一旦它被安置,可以切实维护自己——尤其是当射频识别标签和其他自动检测方法支持包含在其中时。
知晓自己拥有什么硬件,硬件使用年限、确切位置和是否被移动,能够节约大量追踪时间。集成现代服务器内部的监控数据,也是非常珍贵的。你可能会发现利用率下降的设备,并能够调查原因来判断是否重新使用该设备或应用。你还可以选择将其关闭。
数据是关键。这十分必要,但数据也可能是海量的。难道我们真的需要这么多?
区分DCIM之间差异的最大因素是它如何处理海量数据,系统根据这些数据回传了怎样的信息,以及这些信息如何有效、易于访问和连贯性。
好的测试方法是选择一个普通人,没有经过专业的IT培训,也没有经过系统的特殊培训,能够在无须协助的情况下识别报警并采取快速反应。如果不是,则说明图形用户界面的逻辑是值得怀疑的。训练有素的专家很少会在问题出现时左右为难。次要告警——如果正确定义——会根据专家的预测出现故障或失效,但主要告警需要任何人都有资格采取行动,并且摆在数据中心首位。
在产品演示时,需要与销售工程师模拟一个主要问题,然后拨打某个职员的电话来进一步诊断——在没有任何援助的情况下。如果DCIM产品太过复杂或者功能与显示都不够直观,那就继续货比三家。
本文转自d1net(转载)