SpringBoot项目集成HDFS API

  1. Java操作HDFS主要涉及以下几个主要的类
  • Configuration:封装了客户端或者服务器的配置信息;
  • FileSystem:此类的对象是一个文件系统对象,可以用该对象的一些方法来对文件进行操作通过FileSystem的静态方法get获得该对象,例:FileSystem hdfs = FileSystem.get(conf);
  • FSDataInputStream:这是HDFS中的输入流,通过由FileSystem的open方法获取;
  • FSDataOutputStream:这是HDFS中的输出流,通过由FileSystem的create方法获取。
  1. 引入pom依赖
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-common</artifactId>
			<version>3.1.1</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-hdfs</artifactId>
			<version>3.1.1</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-client</artifactId>
			<version>3.1.1</version>
		</dependency>
  1. 使用FileSystem API操作HDFS
    具体使用和操作请参照hdfs-demo(GitHub路径为https://github.com/qzb19950817/hdfs-demo.git)和
    https://blog.csdn.net/linhaiyun_ytdx/article/details/90486277
上一篇:IDEA 在hdfs中创建目录


下一篇:Elasticsearch如何做到亿级数据查询毫秒级返回