实时流处理框架之Storm的安装与部署

2024-04-07 22:41:39

教程目录

0x00 教程内容
0x01 下载Storm
- - - - 1. 下载Storm
      - 2. 上传安装包到节点
0x02 安装与配置Storm
- - - - 1. 解压Storm
      - 2. 配置Storm
0x03 启动并校验Storm
- - - - 1. 启动Storm
      - 2. 校验Storm
0xFF 总结

0x00 教程内容

下载Storm
安装与配置Storm
启动并校验Storm

前提：
先安装好Zookeeper，请查看教程：
D003 复制粘贴玩大数据之安装与配置Zookeeper集群

0x01 下载Storm

1. 下载Storm

a. 为了统一，此处下载apache-storm-1.2.2.tar.gz版本：
http://storm.apache.org/downloads.html

2. 上传安装包到节点

a. 上传到master的/home/hadoop-sny/software上，没有目录则创建：
mkdir ~/software

0x02 安装与配置Storm

1. 解压Storm

a. 解压Storm
tar -zxvf apache-storm-1.2.2.tar.gz -C ~/bigdata/

2. 配置Storm

a. 新建Storm数据文件夹，在每台机器上创建文件目录：
mkdir /home/hadoop-sny/bigdata/storm-data
b. 修改Storm配置
cd ~/bigdata/apache-storm-1.2.2/conf
vi storm.yaml
配置一：配置ZK存储Storm的状态信息（协调Storm的每一个组件）

storm.zookeeper.servers:
    - "master"
    - "slave1"
    - "slave2"

配置二：配置Nimbus和Supervisor在本地磁盘上存储小量的数据（如jars，配置等）
storm.local.dir: "/home/hadoop-sny/bigdata/storm-data"

配置三：配置Nimbus所在的机器名
nimbus.seeds: ["master"]

配置四：配置每个Supervisor节点最多可以启动多少个workers，（一个worker对应一个端口用于接收数据）默认是4个

supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703

如图所示：

c. 同步到安装包到slave1和slave2
scp -r /home/hadoop-sny/bigdata/apache-storm-1.2.2 hadoop-sny@slave1:~/bigdata/
scp -r /home/hadoop-sny/bigdata/apache-storm-1.2.2 hadoop-sny@slave2:~/bigdata/

0x03 启动并校验Storm

1. 启动Storm

前提：
先启动Zookeeper（三个节点都要启动）：
zkServer.sh start

a. 在master上启动Nimbus和Web UI
cd ~/bigdata/apache-storm-1.2.2
nohup bin/storm nimbus 2>&1 &
然后回车，切换终端2，执行：
nohup bin/storm ui 2>&1 &
然后回车
b. 在slave1和slave2上启动Supervisor
cd ~/bigdata/apache-storm-1.2.2
nohup bin/storm supervisor 2>&1 &