Hadoop集群配置安装

安装包资料链接: https://pan.baidu.com/s/1YFbBJNesfhl0eBZ9B3pwKw 提取码: rmba

安装准备

[root@tandelin hadoop]# cd /usr/local/
[root@tandelin hadoop]# ls
[root@tandelin hadoop]# tar -zxvf hadoop-2.5.0-cdh5.3.6.tar.gz
[root@tandelin hadoop]# ls

重命名文件

[root@tandelin hadoop]# mv hadoop-2.5.0-cdh5.3.6 hadoop
[root@tandelin hadoop]# ls
[root@tandelin hadoop]# cd hadoop/
[root@tandelin hadoop]# ls

修改配置文件

#配置环境变量
vi ~/.bashrc
#添加hadoop环境变量
[root@tandelin hadoop]# vi ~/.bashrc
export HADOOP_HOME=/usr/local/hadoop
export PATH= P A T H : PATH: PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin
Hadoop集群配置安装
[root@tandelin hadoop]# source ~/.bashrc

创建namedata

[root@tandelin hadoop]# mkdir /usr/local/data

查看hadoop是否安装配置正确

[root@tandelin hadoop]# hadoop version
[root@tandelin hadoop]# java -version
[root@tandelin hadoop]# vim hadoop-env.sh
[root@tandelin hadoop]# ls
[root@tandelin hadoop]# vim /etc/hadoop/hadoop-env.sh
[root@tandelin hadoop]# find / -name hadoop-env.sh
[root@tandelin hadoop]# vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh
[root@tandelin hadoop]# source /etc/profile
[root@tandelin hadoop]# hadoop version

hadoop启动过程中出现Error: JAVA_HOME is not set and could not be found.解决办法

1.在linux下,如何找java的安装路径

[root@tandelin hadoop]# whereis java
java: /usr/bin/java /usr/share/java /usr/lib/jvm/java-8-openjdk-amd64/bin/java

2.修改hadoop目录下的/etc/hadoop/hadoop-env.sh文件

安装好hadoop后,启动终端和启动hadoop时出现Error: JAVA_HOME is not set and could not be found.错误,需要修改hadoop目录下的/etc/hadoop/hadoop-env.sh文件。用vim hadoop-env.sh打开文件

[root@tandelin hadoop]# vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh

export JAVA_HOME=${JAVA_HOME}

export JAVA_HOME=/usr/
export PATH= J A V A H O M E / b i n : JAVA_HOME/bin: JAVAH​OME/bin:PATH
export CLASSPATH=.: J A V A H O M E / l i b / d t . j a r : JAVA_HOME/lib/dt.jar: JAVAH​OME/lib/dt.jar:JAVA_HOME/lib/tools.jar

Hadoop集群配置安装

环境配置

修改/usr/local/hadoop/etc/hadoop/路径下的配置文件:core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、slaves

[root@tandelin hadoop]# cd /usr/local/hadoop/etc/hadoop/

修改core-site.xml
[root@tandelin hadoop]#  vim core-site.xml


<property>
  <name>fs.default.name</name>
  <value>hdfs://tandelin:9000</value>
</property>
修改hdfs-site.xml
 [root@tandelin hadoop]#  vim hdfs-site.xml
<property>
  <name>dfs.name.dir</name>
  <value>/usr/local/data/namenode</value>
</property>
<property>
  <name>dfs.data.dir</name>
  <value>/usr/local/data/datanode</value>
</property>
<property>
  <name>dfs.tmp.dir</name>
  <value>/usr/local/data/tmp</value>
</property>
<property>
  <name>dfs.replication</name>
  <value>3</value>
</property>
修改mapred-site.xml

先重命名mapred-site.xml.template为mapred-site.xml

   [root@tandelin hadoop]# vim mapred-site.xml 
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>
修改yarn-site.xml
 [root@tandelin hadoop]# vim yarn-site.xml

<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>tandelin</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>
修改slaves文件
   [root@tandelin hadoop]#  vim slaves

tandelin

在另外两台机器上搭建tandelin2、tandelin3

在tandelin机器上执行

搭建第2台机器:

  [root@tandelin hadoop]#    cd /usr/local
  [root@tandelin hadoop]#  scp -r hadoop root@tandelin2:/usr/local
  [root@tandelin hadoop]#   scp ~/.bashrc root@tandelint2:~/
再在tandelin2上执行

对.bashrc文件进行source,以让它生效。

  [root@tandelin2 hadoop]#   source ~/.bashrc
创建data目录。
[root@tandelin2 hadoop]#  mkdir /usr/local/data

使用以下命令进行查看

[root@tandelin2 hadoop]# hadoop version
[root@tandelin2 hadoop]# yarn version
重新启动hdfs集群

格式化namenode
在tandelin上执行以下命令

[root@tandelin hadoop]# hdfs namenode -format
启动hdfs集群

[root@tandelin2 hadoop]# start-dfs.sh

验证启动是否成功

[root@tandelin2 hadoop]# jps

hdfs管理界面:
http://tandelin:50070
Hadoop集群配置安装
Hadoop集群配置安装

启动yarn集群

[root@tandelin2 hadoop]# start-yarn.sh

参考资料:https://www.jianshu.com/p/92720b8ae7d2

上一篇:ffmpeg 用于转换视频格式的各种命令行


下一篇:案例:私设小金库,毁掉响水棉麻厂