1、需要启动yarn进程
$>start-yarn.sh
2、归档文件 archive
一般将一些小文件归档成一个xxx.har的大文件夹,该文件夹下有相应的数据文件。
xxx.har目录是一个整体,将该目录看成一个归档文件即可。
$> hadoop archive -archiveName xxx.har -p 源文件目录
3.查看归档文件
$>hdfs dfs -lsr har:///xxx.har
4.解归档
$>hdfs dfs -cp har:///xxx.har 目标路径