本节书摘来异步社区《Hadoop MapReduce实战手册》一书中的第1章,第1.2节,作者: 【美】Srinath Perera , Thilina Gunarathne 译者: 杨卓荦 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.2 在你的机器上安装Hadoop
Hadoop MapReduce实战手册
本节讲述如何在本地模式下运行Hadoop。
准备工作
从http://www.oracle.com/technetwork/java/javase/downloads/index.html下载并安装Java 1.6或者更高版本。
操作步骤
现在让我们来完成Hadoop的安装。
- 从http://hadoop.apache.org/下载最新的Hadoop 1.0分支发行版。
- 使用下列命令解压Hadoop发行版。必须将文件名中的x.x换成你实际下载的版本号。如果你使用的是Windows,可以使用自己喜欢的解压缩工具(如WinZip或者WinRAR)去解压发行包。从现在的情况来看,我们应该把解压后的Hadoop目录叫做HADOOP_HOME。
>tar -zxvf hadoop-1.x.x.tar.gz
- 在解压完发行版之后,就可以使用Hadoop的本地模式了。安装也就完成了。现在,你可以通过bin/hadoop命令运行Hadoop作业了,我们将在下一节中详尽阐述。
工作原理
Hadoop本地模式并不启动任何服务进程,而是在同一个JVM中完成所有的工作。当你在Hadoop本地模式中提交一个作业时,这个作业启动一个JVM去运行并完成该作业。作业的输出和行为与分布式的Hadoop作业相同,只是作业只能使用当前的节点运行任务。在1.3节中,我们将探索如何使用解压后的Hadoop发行版去运行一个MapReduce程序。