1. 配置 hadoop
-
依赖:
JDK
1、解压 hadoop
到 F:\software\hadoop-2.7.1
,配置文件位置:F:\software\hadoop-2.7.1\etc\hadoop
2、core-site.xml
(配置默认hdfs
的访问端口),新建 tmp
目录:
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/F:/software/hadoop-2.7.1/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
3、hdfs-site.xml
(设置复制数为1,即不进行复制。namenode
文件路径以及datanode
数据路径),新建 namenode、datanode
目录:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value> <!-- 这个参数设置为1,因为是单机版hadoop -->
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/F:/software/hadoop-2.7.1/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/F:/software/hadoop-2.7.1/data/datanode</value>
</property>
</configuration>
4、将mapred-site.xml.template
名称修改为 mapred-site.xml
后再修改内容(设置mr
使用的框架,这里使用yarn
):
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>hdfs://localhost:9001</value>
</property>
</configuration>
5、yarn-site.xml
(这里yarn
设置使用了mr
混洗):
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
6、hadoop-env.cmd
,设置JAVA_HOME
的值:
set JAVA_HOME=C:\Program Files\Java\jdk1.8.0_261
# 或者 C:\PROGRA~1 表示 C:\Program Files
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_261
7、将 bin/hadoop.dll
拷贝到 C:\Windows\System32
,没有则从 winutils 下载对应版本
2. 启动
1、bin
目录,格式化 hdfs
:
hadoop namenode -format
2、sbin
目录:
start-all.cmd
# 停止
stop-all.cmd
3、查看进程:
F:\software\hadoop-2.7.1\sbin>jps
2752 NameNode
11668 ResourceManager
5284 Jps
8504 DataNode
4、在浏览器地址栏中输入:http://localhost:8088
查看集群状态。
5、在浏览器地址栏中输入:http://localhost:50070
查看 Hadoop
状态
参考文章
https://www.cnblogs.com/chevin/p/9090683.html
3. 搭建 hbase
如果启动 hbase
时, HMaster
进程总是掉线,可以考虑将 hadoop/bin
中文件替换为 hadooponwindows-master/bin
hadoop
与 hbase
版本对应关系:https://www.pianshen.com/article/887057118/
下载地址:
1、下载解压 hadoop-2.7.1、hbase-1.2.2
2、添加 hadoop/bin、sbin、hbase/bin
到环境变量
3、修改 hbase-env.cmd
:
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_261
set HBASE_MANAGES_ZK=false
4、修改 hbase-site.xml
,hbase-1.2.2
目录新建 hbdata/root、zoo、tmp
三个目录:
<configuration>
<property>
<name>hbase.master</name>
<value>localhost</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>file:///F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/root</value>
</property>
<property>
<name>hbase.tmp.dir</name>
<value>F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/tmp</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>localhost</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>F:/software/hadoop-hbase-test/hbase-1.2.2/hbdata/zoo</value>
</property>
<!-- 外部ZK此处必须为true,不然hbase仍用自带的zk,若启动了外部的zookeeper,会导致冲突,hbase启动不起来 -->
<property>
<name>hbase.cluster.distributed</name>
<value>false</value>
</property>
<!-- HMaster UI端口 -->
<property>
<name>hbase.master.info.port</name>
<value>61510</value>
</property>
</configuration>
5、将 winutils.exe、hadoop.dll
拷贝到 hadoop-2.7.1\bin
目录中,再将 hadoop.dll
拷贝到 C:\Windows\System32
目录中
6、启动 hbase
:
cd F:\software\hadoop-hbase-test\hbase-1.2.2\bin
start-hbase.cmd
7、浏览器访问:http://127.0.0.1:61510/
参考文章:
- https://blog.csdn.net/liyongke89/article/details/81744566
- https://blog.csdn.net/a2099948768/article/details/79577246
- https://www.jianshu.com/p/dae6337790da
- http://www.blogjava.net/anchor110/articles/424888.html
- https://www.cnblogs.com/chevin/p/9090683.html
- https://blog.csdn.net/chinuoye3292/article/details/100797570
- https://www.cnblogs.com/taoweizhong/p/10526999.html