大数据发展里程-Hadoop视角

2024-01-19 12:03:22

周末查询了一些大数据相关的资料，今天简单以Hadoop的视角来总结一下我对大数据发展里程的总结：

2004：Google 发表大数据论文， “三驾马车”横空出世

2006：Nutch 搜索引擎分离出 Hadoop

Doug Cutting 将大数据相关的功能从 Nutch 中分离出来

2007：陆续应用于雅虎、百度、阿里等企业

Hadoop 应用于互联网大厂的大数据存储与计算

2008：Hadoop 成为 Apache *项目

2011：Hadoop 生态逐步形成

2012：Yarn 资源调度系统

Spark 开始崭露头角：源于伯克利 AMP 实验室。

新概念引入：

大数据流计算、大数据实时计算

大数据分析与大数据仓库

大数据挖掘与机器学习

本次总结粒度比较粗，面相对窄。后续我们继续

码农公寓