(转)hadoop基本操作命令

2023-08-03 11:18:52

http://www.cnblogs.com/gpcuster/archive/2010/06/04/1751538.html

在这篇文章中，我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。

假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。

启动与关闭

启动HADOOP

进入HADOOP_HOME目录。
执行sh bin/start-all.sh
进入HADOOP_HOME目录。
执行sh bin/stop-all.sh

关闭HADOOP

文件操作

Hadoop使用的是HDFS，能够实现的功能和我们使用的磁盘系统类似。并且支持通配符，如*。

查看文件列表

查看hdfs中/user/admin/aaron目录下的文件。

进入HADOOP_HOME目录。
执行sh bin/hadoop fs -ls /user/admin/aaron

这样，我们就找到了hdfs中/user/admin/aaron目录下的文件了。

我们也可以列出hdfs中/user/admin/aaron目录下的所有文件（包括子目录下的文件）。

进入HADOOP_HOME目录。
执行sh bin/hadoop fs -lsr /user/admin/aaron

创建文件目录

查看hdfs中/user/admin/aaron目录下再新建一个叫做newDir的新目录。

进入HADOOP_HOME目录。
执行sh bin/hadoop fs -mkdir /user/admin/aaron/newDir

删除文件

删除hdfs中/user/admin/aaron目录下一个名叫needDelete的文件

进入HADOOP_HOME目录。
执行sh bin/hadoop fs -rm /user/admin/aaron/needDelete

删除hdfs中/user/admin/aaron目录以及该目录下的所有文件

进入HADOOP_HOME目录。
执行sh bin/hadoop fs -rmr /user/admin/aaron

上传文件

上传一个本机/home/admin/newFile的文件到hdfs中/user/admin/aaron目录下

进入HADOOP_HOME目录。
执行sh bin/hadoop fs –put /home/admin/newFile /user/admin/aaron/

下载文件

下载hdfs中/user/admin/aaron目录下的newFile文件到本机/home/admin/newFile中

进入HADOOP_HOME目录。
执行sh bin/hadoop fs –get /user/admin/aaron/newFile /home/admin/newFile

查看文件

我们可以直接在hdfs中直接查看文件，功能与类是cat类似

查看hdfs中/user/admin/aaron目录下的newFile文件

进入HADOOP_HOME目录。
执行sh bin/hadoop fs –cat /home/admin/newFile

MAPREDUCE JOB操作

提交MAPREDUCE JOB

原则上说，Hadoop所有的MapReduce Job都是一个jar包。

运行一个/home/admin/hadoop/job.jar的MapReduce Job

进入HADOOP_HOME目录。
执行sh bin/hadoop jar /home/admin/hadoop/job.jar [jobMainClass] [jobArgs]

杀死某个正在运行的JOB

假设Job_Id为：job_201005310937_0053

进入HADOOP_HOME目录。
执行sh bin/hadoop job -kill job_201005310937_0053

码农公寓

(转)hadoop基本操作命令

启动与关闭

启动HADOOP

关闭HADOOP

文件操作

查看文件列表

创建文件目录

删除文件

上传文件

下载文件

查看文件

MAPREDUCE JOB操作

提交MAPREDUCE JOB

杀死某个正在运行的JOB

更多HADOOP的命令

码农公寓

启动与关闭

启动HADOOP

关闭HADOOP

文件操作

查看文件列表

创建文件目录

删除文件

上传文件

下载文件

查看文件

MAPREDUCE JOB操作

提交MAPREDUCE JOB

杀死某个正在运行的JOB

更多HADOOP的命令

相关文章