今年早些时候,我们看到了很多臭名昭著且令人担忧的数据泄漏事件,其中数以万计未受保护的MongoDB和Elasticsearch数据库遭到黑客入侵并索要赎金,以交换黑客们从它们配置不当的系统中所窃取和删除的数据。
现在,网络犯罪分子又开始将目光瞄准未受保护的Hadoop Clusters和CouchDB服务器,如果您的服务器未曾进行安全地配置,那么我想这场勒索游戏将会变得更加糟糕。
根据使用Shodan搜索引擎进行的分析结果发现,配置Hadoop分布式文件系统(HDFS,Hadoop应用程序使用的主要分布式存储)的近4500台服务器,已经暴露了超过5120TB(5.12PB)的数据。
此次泄漏事件也是出于一个相同的问题——基于HDFS的服务器(主要是Hadoop安装)缺乏安全配置。
Hadoop大数据灾难
Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。它是一个高度容错性的系统,适合部署在廉价的机器上,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。像其他Hadoop相关技术一样,HDFS已经成为管理大型数据集群以及支持大数据分析应用的主要工具。
在一篇博客文章中,Shodan创始人John Matherly透露称,虽然MongoDB和Elasticsearch数据库此前发生的数据泄漏事件引发了大规模的关注和担忧,但现在事实证明,Hadoop服务器才是“真正的数据泄漏巨头”。
Matherly 进一步解释称,超过47800台MongoDB服务器仅仅泄露了25TB的数据,而总共只有4487台的 HDFS服务器却泄漏了超过5000TB的数据量。如此说来,HDFS服务器在总量少于MongoDB服务器10倍的情况下,却泄露了多出MongoDB服务器200余倍的数据量。这一结果,着实令人震惊,也算是做实了“泄漏巨头”的称号。
HDFS服务器大多位于美国和中国
作为此次泄漏事件的主角,大多的HDFS服务器主要位于美国(1900台)和中国(1426台),其次是德国(129台)和韩国(115台)。
而其中大多数的HDFS实例主要托管在云中,亚马逊Web服务以1059个实例处于领先位置,其次是阿里巴巴,数量为507个。
去年年底至今年年初,我们发现攻击者开始有意识地针对未受保护的数据库进行勒索攻击,其中最先受难的是MongoDB和Elasticsearch数据库,Matherly表示,现在这些攻击并未停止活动,不仅危害着 MongoDB 同时也影响 CouchDB和Hadoop服务器的部署。
最后,Matherly还分享了关于如何使用Shodan搜索引擎复制检测设备的所有必要步骤,用户可以利用该搜索引擎自己着手进行调查。此外,安全专家也建议企业设备管理人员在安全模式下,按照指令说明正确地配置 Hadoop 服务器,避免给恶意攻击者可乘之机。