**大数据技术生态体系:
Hadoop是什么:
**
1·分布式系统基础架构
什么是分布式系统 100T的文件 由100个服务器存储 即需要多台服务器同时运行
基础架构? 所有的框架都基于Hadoop执行
2.主要解决 海量数据的存储和分析计算问题
3.广义上指Hadoop生态圈
Google在大数据方面的三篇论文
Hadoop的优势:
Hadoop的组成:
HDFS概述:
YARN结构概述:
理解为Resource Manager是一个公司的部门经理
Node Manager是一个公司的项目经理
App Mstr就是一个小的项目
Container是一个容器,用于App Mstr的正常运行
这里是引用
MapReduce架构概述:
案例:
** 怎么被大数据推荐商品的??**