Apache Hadoop完全分布式集群搭 建

第 1 节 虚拟机环境准备

1、VMware和centos的安装百度搜索相关资料

2. 三台虚拟机(静态IP,关闭防?墙,修改主机名,配置免密登录,集群时间同步)

3、安装JDK版本,推荐安装JDK8,并配置环境变量

第 2 节 安装Hadoop

1、将Hadoop安装包上传到Linux服务器,并解压到指定目录,路径可以根据自己的需要进行设置;

2、配置环境变量,添加Hadoop到环境变量 vim /etc/profile

##HADOOP_HOME
export HADOOP_HOME=/opt/lagou/servers/hadoop-2.9.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

3、环境变量?效

source /etc/profile

4、查看Hadoop版本是否安装成功

hadoop version

校验结果:

Apache Hadoop完全分布式集群搭 建

3.1 集群配置

Hadoop集群配置 = HDFS集群配置 + MapReduce集群配置 + Yarn集群配置

HDFS集群配置

1. 将JDK路径明确配置给HDFS(修改hadoop-env.sh)

2. 指定NameNode节点以及数据存储?录(修改core-site.xml)

3. 指定SecondaryNameNode节点(修改hdfs-site.xml)

4. 指定DataNode从节点(修改etc/hadoop/slaves?件,每个节点配置信息占??)

MapReduce集群配置

1. 将JDK路径明确配置给MapReduce(修改mapred-env.sh)

2. 指定MapReduce计算框架运?Yarn资源调度框架(修改mapred-site.xml)

Yarn集群配置

1. 将JDK路径明确配置给Yarn(修改yarn-env.sh)

2. 指定ResourceManager??节点所在计算机节点(修改yarn-site.xml)

3. 指定NodeManager节点(会通过slaves?件内容确定)

集群配置具体步骤:

HDFS集群配置

cd /opt/lagou/servers/hadoop-2.9.2/etc/hadoop

配置:hadoop-env.sh;将JDK路径明确配置给HDFS

vim hadoop-env.sh


export JAVA_HOME=/opt/lagou/servers/jdk1.8.0_231

指定NameNode节点以及数据存储?录(修改core-site.xml)

vim core-site.xml

<!-- 指定HDFS中NameNode的地址 -->
<property>
 <name>fs.defaultFS</name>
 <value>hdfs://linux111:9000</value>
</property>
<!-- 指定Hadoop运?时产??件的存储?录 -->
<property>
 <name>hadoop.tmp.dir</name>
 <value>/opt/lagou/servers/hadoop-2.9.2/data/tmp</value>
</property>

指定secondarynamenode节点(修改hdfs-site.xml)

vim hdfs-site.xml
<!-- 指定Hadoop辅助名称节点主机配置 -->
<property>
 <name>dfs.namenode.secondary.http-address</name>
 <value>linux112:50090</value>
</property>
<!--副本数量 -->
<property>
 <name>dfs.replication</name>
 <value>3</value>
</property>

指定datanode从节点(修改slaves?件,每个节点配置信息占??)

vim slaves


linux121
linux122
linux123

注意:该?件中添加的内容结尾不允许有空格,?件中不允许有空?。

MapReduce集群配置 指定MapReduce使?的jdk路径(修改mapred-env.sh)

vim mapred-env.sh


export JAVA_HOME=/opt/lagou/servers/jdk1.8.0_231

指定MapReduce计算框架运?Yarn资源调度框架(修改mapred-site.xml)

mv mapred-site.xml.template mapred-site.xml


vim mapred-site.xml


<!-- 指定MR运?在Yarn上 -->
<property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
</property>

Yarn集群配置

指定JDK路径 vim yarn-env.sh export JAVA_HOME=/opt/lagou/servers/jdk1.8.0_231 指定ResourceMnager的master节点信息(修改yarn-site.xml)

vim yarn-site.xml

<!-- 指定YARN的ResourceManager的地址 -->
<property>
 <name>yarn.resourcemanager.hostname</name>
 <value>linux123</value>
</property>
<!-- Reducer获取数据的?式 -->
<property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
</property>

指定NodeManager节点(slaves?件已修改)yarn的文件与hdfs文件公用

注意: Hadoop安装?录所属?户和所属?户组信息,默认是501 dialout,?我们操作Hadoop集群的?户使 ?的是虚拟机的root?户, 所以为了避免出现信息混乱,修改Hadoop安装?录所属?户和?户组!!

chown -R root:root /opt/lagou/servers/hadoop-2.9.2

 

Apache Hadoop完全分布式集群搭 建

上一篇:[.Net 5.0] 8.异常的Json序列化


下一篇:HTML基础属性