HDFS 块的大小设置| 学习笔记

开发者学堂课程【Hadoop 分布式文件系统 HDFSHDFS 块的大小设置】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/93/detail/1436


HDFS块的大小设置


内容介绍:

一、  HDFS文件块大小

二、 例题:


一、  HDFS文件块大小

HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来规定,默认大小在Hadoop2.x版本中是128M,老版本中是64M。
注:

1.  集群中的 block(如下图)。

2.  如果寻址时间约为10ms,即查找到目标 block 的时间为10ms。

3.  寻址时间为传输时间的1%时,为最佳状态。 因此,传输时间=10ms/0.01=1000ms=1s。

4.  而目前磁盘的传输速率普遍为100MB/s。

5.  block 大小=1s*100MB/s=100MB

HDFS 块的大小设置| 学习笔记


二、 例题:

为什么块的大小不能设置太小,也不能设置太大?

1.  HDFS 的块设置太小,会增加寻址时间,程序一直在找块的开始位置;

2.  如果块设置的太大,从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。

导致程序在处理这块数据时,会非常慢。
总结:HDFS 块的大小设置主要取决于磁
盘传输速率。

上一篇:python 函数


下一篇:HDFS 读数据流程| 学习笔记