Hadoop 三大发行版本:Apache、Cloudera、Hortonworks。
Hadoop 云厂商:阿里云飞天、腾讯云TBDS
Apache
Apache hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。它被设计成从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依赖硬件来提供高可用性,而是设计用于在应用层检测和处理故障,因此在计算机集群上提供高可用性服务,每个计算机集群都可能发生故障,基于Google三个论文做了实现,适合学习大数据同学。
Cloudera Hadoop
https://www.cloudera.com/downloads/cdh
CDH 是 Cloudera 的 Hadoop 发行版,完全开源,比 Apache Hadoop 在兼容性,安
全性,稳定性上有所增强。Cloudera 的标价为每年每个节点 10000 美元。
Cloudera Manager 是集群的软件分发及管理监控平台,可以在几个小时内部署好一
个 Hadoop 集群,并对集群的节点及服务进行实时监控。
Hortonworks Hadoop
https://hortonworks.com/products/data-center/hdp/
2011 年成立的 Hortonworks 是雅虎与硅谷风投公司 Benchmark Capital 合资组建,公司成立之初就吸纳了大约 25 名至 30 名专门研究 Hadoop 的雅虎工程师,上述工程师均在 2005 年开始协助雅虎开发 Hadoop,贡献了 Hadoop 80%的代码,Hortonworks 的主打产品是 Hortonworks Data Platform(HDP),也同样是 100%开源的产品,HDP 除常见的项目外还包括了 Ambari,一款开源的安装和管理系统,目前已经被 Cloudera 公司收购。
阿里云飞天大数据
飞天大数据平台是阿里巴巴10年大数据建设最佳实践的结晶
每天有数万名数据和算法工程师正在使用飞天大数据平台,承载了阿里巴巴99%的数据业务构建
同时广泛应用于城市大脑、数字*、电力、金融、新零售、智能制造、智慧农业等各个领域的大数据建设。
腾讯TBDS
腾讯云提供了涵盖大数据基础设施和大数据应用在内的丰富产品及服务,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势。