hdfs的实现机制和文件系统概念

1、HDFS的诞生背景:

数据量太大,在一个结点(机器)存不下。所以需要分布式存储,HDFS就是hadoop的分布式文件系统,来存储分布式数据。

2、共享文件系统
也是一种分布式存储
但有缺点:
1、并发差,比如10个客户端并发去读写某个资源,就会存在负载问题。
2、可靠性差,如果某台计算机坏了,该台计算机上的共享资源就用不了了。
3、资源在各台计算机之间移动、调整比较麻烦。

3、HDFS能够解决上述几个缺点,它的优点:
1、容量可以线性扩展。
2、有副本机制,存储可靠性高,吞吐量增大。
3、有了namenode后,客户端访问文件就只需要制定hdfs上的路径。

4、HDFS的实现机制:
1、文件是被切块存储在多台服务器上,存储在各台服务器的本地文件系统中。
2、对于客户端来说,不需要关心分布式的细节,因为hdfs提供了一个抽象的统一的目录树。
3、每一个文件块都可以保存多个副本
4、hdfs中的文件和具体实际存储位置之间的对应关系交由一个专门的服务器来管理。

hdfs的实现机制和文件系统概念

5、思考:如果namenode挂了怎么办?

上一篇:【转】overload与override的区别


下一篇:浅谈Log4j和Log4j2的区别