- Java操作HDFS主要涉及以下几个主要的类
- Configuration:封装了客户端或者服务器的配置信息;
- FileSystem:此类的对象是一个文件系统对象,可以用该对象的一些方法来对文件进行操作通过FileSystem的静态方法get获得该对象,例:FileSystem hdfs = FileSystem.get(conf);
- FSDataInputStream:这是HDFS中的输入流,通过由FileSystem的open方法获取;
- FSDataOutputStream:这是HDFS中的输出流,通过由FileSystem的create方法获取。
- 引入pom依赖
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>3.1.1</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>3.1.1</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>3.1.1</version>
</dependency>
- 使用FileSystem API操作HDFS
具体使用和操作请参照hdfs-demo(GitHub路径为https://github.com/qzb19950817/hdfs-demo.git)和
https://blog.csdn.net/linhaiyun_ytdx/article/details/90486277。