三、配置Hadoop
1、设置$HADOOP_HOME/conf/hadoop-env.sh
这个文件里设置的是Hadoop运行时须要的环境变量,在1.2.1版*同拥有19个环境变量。例如以下:
变量名称 |
默认值 |
说明 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
JAVA_HOME |
|
设置JDK的路径。这个必须设置。否则Hadoop无法启动,值如: /usr/local/jdk1.6.0_33 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HADOOP_CLASSPATH |
空 |
这个用以设置用户的类路径。也能够在运行计算之前设置 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HADOOP_HEAPSIZE |
1000m |
设置Hadoop堆的大小,依据自己环境的实际情况进行设置了。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HADOOP_OPTS |
-server |
Hadoop启动时的JVM參数,默认是以server模式启动。能够添加-X或-XX之类的參数 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
HADOOP_NAMENODE_OPTS |
-Dcom.sun.management.jmxremote $HADOOP_NAMENODE_OPTS |
该选项的值会附加到HADOOP_OPTS之后。在启动NameNode时设置的JVM參数。 如想手动设置NameNode的堆、垃圾回收等信息,能够在这里设置: ,我的内存没有这么大而且測试用例不会用到那么大的堆,所以我也设置了一个这个值。
HADOOP_PID_DIR: Hadoop PID文件的存放文件夹,这个最好是改动一下,由于/tmp文件夹通常来说是不论什么人都能够訪问的。有可能存在符合链接攻击的风险。
2、配置$HADOOP_HOME/conf/core-site.xml參数例如以下(部分):
配置演示样例:
3、配置$HADOOP_HOME/conf/mapred-site.xml文件參数例如以下(部分):
|