hadoop的运行环境为 JDK, 操作系统为Linux
1 装Linux, Ubuntu/Centos
可以选择使用虚拟机装Ubuntu
2 装JDK
Ubuntu下使用 apt-get install openjdk-7-jdk 安装jdk7
配置java环境变量 vim /etc/profile 中配置 JAVA_HOME、
JRE_HOME=\$JAVA_HOME/jre、
CLASS_HOME=\$JAVA_HOME/lib:\$JRE_HOME/lib:\$CLASS_HOME、
PATH=\$JAVA_HOME/bin:\$JRE_HOME/bin:\$PATH
然后 source 使配置文件生效
3 装 hadoop
使用 wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz 获取压缩包
解压 tar zxvf …
4 配置hadoop环境变量
vim /etc/profile 中
HADOOP_HOME=hadoop安装目录
PATH=\$HADOOP_HOME/bin:\$PATH
配置hadoop配置文件,1.2.1版本下,在conf目录下配置 core-site.xml(工作目录) hdfs-site.xml(数据目录) mapred-site.xml(任务调度目录)
<!--core-site.xml-->
<name>hadoop.tmp.dir</name> //hadoop主目录
<value>/hadoop</value>
</property>
<property>
<name>dfs.name.dir</name> //数据主目录
<value>/hadoop/name</value>
</property>
<property>
<name>fs.default.name</name> //文件系统访问链接
<value>hdfs://localhost:9000</value>
<!--hdfs-site.xml-->
<property>
<name>dfs.data.dir</name> //数据存储目录
<value>/hadoop/data</value>
</property>
<!--mapred-site.xml-->
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
5 启动前需要格式化文件系统
hadoop namenode -format
6 启动hadoop
$HADOOP_HOME/bin/start-all.sh