第一天的笔记,是伪分布hadoop集群搭建,
后面是hadoop Ha的分布式集群搭建
第一天,是HDFS的shell操作
NN工作机制
里面是二进制
DN工作原理
上传完了之后,在hdfs的虚拟路径下,有这个文件,其实,是切分成很多block,放到公共的datanode文件夹下。
134217728/1024/1024=128M,所以,分成2个Block。
其实,此刻,blk_1073741856等价于jdk-7u65-linux-i586.tar.gz。
所以,文件被是切分成很多block,放到公共的datanode文件夹下。也可以合并,上述,就是合并,照样,达到复原。。。
这里,有个知识点,blk_1073741856和blk_1073741857,没有显示出来。
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5893338.html,如需转载请自行联系原作者