伪分布模式安装hadoop

准备工具:

虚拟机:VMware

Linux系统:CentOS

hadoop-1.1.2.tar.gz

jdk-7u75-linux-x64.gz

CentOS的网络配置

1、设置主机中VMware Network Adapter VMnet1的IPv4协议如下:

伪分布模式安装hadoop

2、修改虚拟机虚拟网络的VMnet1的ip

伪分布模式安装hadoop

3、CentOS中网络配置:

伪分布模式安装hadoop

3、重启网卡: net service restart

伪分布模式安装步骤

1.1 设置ip地址

执行命令 service network restart

验证: ifconfig

1.2 关闭防火墙

执行命令 service iptables stop

验证: service iptables status

1.3 关闭防火墙的自动运行

执行命令 chkconfig iptables off

验证: chkconfig --list | grep iptables

扩展:

[root@localhost ~]# service   iptables status

停止防火墙:

[root@localhost ~]# service   iptables stop

启动防火墙:

[root@localhost ~]# service   iptables start

重启防火墙:

[root@localhost ~]# service   iptables restart

永久关闭防火墙:

[root@localhost ~]# chkconfig   iptables off

永久关闭后启用:

[root@localhost ~]# chkconfig   iptables on

以上两步,我的操作老是显示服务不存在,也许是我主机中防火墙被关闭了吧!

1.4 设置主机名

执行命令 (1)hostname staven

(2)vi /etc/sysconfig/network

伪分布模式安装hadoop

1.5 ip与hostname绑定

执行命令 vi /etc/hosts

验证: ping staven

1.6 设置ssh免密码登陆

执行命令 (1)ssh-keygen -t rsa

(2)cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

验证: ssh staven

扩展:

ssh配置

主机A:10.0.5.199

主机B:10.0.5.198

需要配置主机A无密码登录主机A,主机B

先确保所有主机的防火墙处于关闭状态。

在主机A上执行如下:

1. cd ~/.ssh

2. ssh-keygen -t rsa  --------------------然后一直按回车键,就会按照默认的选项将生成的密钥保存在.ssh/id_rsa文件中。(linux下可以用用ssh-keygen生成公钥/私钥对)

3. cp id_rsa.pub authorized_keys

这步完成后,正常情况下就可以无密码登录本机了,即ssh localhost,无需输入密码。

4. scp authorized_keys summer@10.0.5.198:/home/summer/.ssh   ------把刚刚产生的authorized_keys文件拷一份到主机B上.

5. chmod 600 authorized_keys

进入主机B的.ssh目录,改变authorized_keys文件的许可权限。

(4和5可以合成一步,执行:  ssh-copy-id -i summer@10.0.5.198 )

可能遇到的问题:

1.ssh连接The authenticity of host can't be established

解决办法:

mv  /home/staven/.ssh/known_hosts known_hosts.bak

再连:ssh  -o StrictHostKeyChecking=no  192.168.56.100

或者修改/etc/ssh/ssh_config文件的配置,以后则不会再出现此问题

最后面添加:

StrictHostKeyChecking no

UserKnownHostsFile /dev/null

2.进行ssh登录时,出现:”Agent admitted failure to sign using the key“ .

解决办法:

ssh-add

强行将私钥 加进来。

3.如果无任何错误提示,可以输密码登录,但就是不能无密码登录,在被连接的主机上(如A向B发起ssh连接,则在B上)执行以下几步:

chmod o-w ~/

chmod 700 ~/.ssh

chmod 600 ~/.ssh/authorized_keys
4.如果执行了第2步,还是不能无密码登录,再试试下面几个

ps -Af | grep agent

检查ssh代理是否开启,如果有开启的话,kill掉该代理,然后执行下面,重新打开一个ssh代理,如果没有开启,直接执行下面:

ssh-agent

还是不行的话,执行下面,重启一下ssh服务

sudo service sshd restart

5. 执行ssh-add时提示“Could not open a connection to your authenticationh agent”而失败

解决办法:执行: ssh-agent bash

1.7 安装jdk

执行命令 (1)cd /usr/local

(2)chmod u+xjdk-7u75-linux-x64.gz

(3)tar -zxvf jdk-7u75-linux-x64.gz

(4)mv jdk1.7.0_75  jdk

(5)vi /etc/profile 增加内容如下:

export JAVA_HOME=/usr/local/jdk

export PATH=.:$JAVA_HOME/bin:$PATH

(6)source /etc/profile

验证: java -version

1.8 安装hadoop

执行命令 (1)tar -zxvf hadoop-1.1.2.tar.gz

(2)mv hadoop-1.1.2 hadoop

(3)vi /etc/profile 增加内容如下:

export JAVA_HOME=/usr/local/jdk

export HADOOP_HOME=/usr/local/hadoop

export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH

(4)source /etc/profile

(5)修改conf目录下的配置文件hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml

1.hadoop-env.sh

export JAVA_HOME=/usr/local/jdk/

注意:hadoop-env.sh中export JAVA_HOME=/cygdrive/d/JDK 注意:export前面符号“#”是注释,要去掉;JAVA_HOME值一定要设置成你的JDK的安装路径。

2.core-site.xml


<configuration>


<property>


<name>fs.default.name</name>


<value>hdfs://staven:9000</value>


</property>


<property>


<name>hadoop.tmp.dir</name>


<value>/usr/local/hadoop/tmp</value>


</property>


</configuration>

 

3.hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

4.mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>staven:9001</value>

</property>

</configuration>

(6)hadoop namenode -format

(7)start-all.sh

验证: (1)执行命令jps 如果看到5个新的java进程,分别是NameNode、SecondaryNameNode、DataNode、JobTracker、TaskTracker

(2)在浏览器查看,http://staven:50070  http://staven:50030

1.9 启动时没有NameNode的可能原因:

(1)没有格式化

(2)环境变量设置错误

(3)ip与hostname绑定失败

上一篇:scrapy初试水 day03(递归调用)


下一篇:一脸懵逼学习基于CentOs的Hadoop集群安装与配置(三台机器跑集群)