《Hadoop MapReduce实战手册》一1.7 HDFS的基本命令行文件操作

本节书摘来异步社区《Hadoop MapReduce实战手册》一书中的第1章,第1.7节,作者: 【美】Srinath Perera , Thilina Gunarathne 译者: 杨卓荦 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.7 HDFS的基本命令行文件操作

Hadoop MapReduce实战手册
HDFS是一个分布式的文件系统,就像一个Unix文件系统一样,它允许用户使用shell命令操纵文件系统。本节将说明如何使用HDFS的基本命令行来执行这些操作。

值得注意的是,每一条HDFS命令都有一个与之一一对应的Unix命令。例如,下面的命令:

>hadoopdfs –cat /data/foo.txt

该命令用于读取/data/foo.txt文件,并把它打印到屏幕上,就像Unix系统的cat命令一样。

准备工作
通过以下安装HDFS的攻略,启动HDFS服务器。

操作步骤

  1. 将工作目录跳转到HADOOP_HOME。
  2. 运行下面的命令来新建一个名为/test的目录:
>bin/hadoopdfs -mkdir /test
  1. HDFS文件系统的根目录为/,就像Unix文件系统的根目录一样。运行以下命令可以列出HDFS根目录的内容:
>bin/hadoopdfs -ls /
  1. 运行下面的命令将本地readme文件复制到/test目录下:
>bin/hadoopdfs -put README.txt /test
  1. 运行下面的命令列出/test目录的内容:
>bin/hadoopdfs -ls /test

Found 1 items
-rw-r--r-- 1 srinathsupergroup   1366 2012-04-10 07:06 /
test/README.txt
  1. 运行以下命令将/test/README.txt文件复制到本地目录:
>bin/hadoopdfs -get /test/README.txt README-NEW.txt

工作原理
当命令发出后,客户端将代表用户与HDFS NameNode通信,并执行相关操作。通常,我们使用以/开头的路径来引用文件或文件夹,如/data,客户端将根据HADOOP_HOME/conf目录中的配置项来选择NameNode。

然而,如果需要的话,我们可以使用一个完全限定路径来强制客户端跟一个特定的NameNode进行通信。例如,hdfs://bar.foo.com:9000/data,会要求客户端与运行在bar.foo.com主机9000端口上的NameNode进行通信。

更多参考
HDFS支持大多数的Unix命令,如cp、mv和chown,它们与上面讨论的命令一样,遵循相同的模式。文档http://hadoop.apache.org/docs/r1.0.3/file_system_shell.html提供了所有支持命令的列表。我们将在本书中通篇使用这些命令。

上一篇:ffpanel --ffmpeg的GUI,让ffmpeg离开黑黑的命令行


下一篇:JavaScript 中对变量和函数声明提前的示例