实时流处理框架之Storm的安装与部署

 

教程目录

 

0x00 教程内容
  1. 下载Storm
  2. 安装与配置Storm
  3. 启动并校验Storm

前提:
先安装好Zookeeper,请查看教程:
D003 复制粘贴玩大数据之安装与配置Zookeeper集群

0x01 下载Storm
1. 下载Storm

a. 为了统一,此处下载apache-storm-1.2.2.tar.gz版本:
http://storm.apache.org/downloads.html

2. 上传安装包到节点

a. 上传到master的/home/hadoop-sny/software上,没有目录则创建:
mkdir ~/software

0x02 安装与配置Storm
1. 解压Storm

a. 解压Storm
tar -zxvf apache-storm-1.2.2.tar.gz -C ~/bigdata/

2. 配置Storm

a. 新建Storm数据文件夹,在每台机器上创建文件目录:
mkdir /home/hadoop-sny/bigdata/storm-data
b. 修改Storm配置
cd ~/bigdata/apache-storm-1.2.2/conf
vi storm.yaml
配置一:配置ZK存储Storm的状态信息(协调Storm的每一个组件)

storm.zookeeper.servers:
    - "master"
    - "slave1"
    - "slave2"

配置二:配置Nimbus和Supervisor在本地磁盘上存储小量的数据(如jars,配置等)
storm.local.dir: "/home/hadoop-sny/bigdata/storm-data"

配置三:配置Nimbus所在的机器名
nimbus.seeds: ["master"]

配置四:配置每个Supervisor节点最多可以启动多少个workers,(一个worker对应一个端口用于接收数据)默认是4个

supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703

如图所示:
实时流处理框架之Storm的安装与部署
c. 同步到安装包到slave1和slave2
scp -r /home/hadoop-sny/bigdata/apache-storm-1.2.2 hadoop-sny@slave1:~/bigdata/
scp -r /home/hadoop-sny/bigdata/apache-storm-1.2.2 hadoop-sny@slave2:~/bigdata/

0x03 启动并校验Storm
1. 启动Storm

前提:
先启动Zookeeper(三个节点都要启动):
zkServer.sh start
实时流处理框架之Storm的安装与部署
a. 在master上启动Nimbus和Web UI
cd ~/bigdata/apache-storm-1.2.2
nohup bin/storm nimbus 2>&1 &
然后回车,切换终端2,执行:
nohup bin/storm ui 2>&1 &
然后回车
b. 在slave1和slave2上启动Supervisor
cd ~/bigdata/apache-storm-1.2.2
nohup bin/storm supervisor 2>&1 &

2. 校验Storm

a. 查看各节点进程
实时流处理框架之Storm的安装与部署
b. Web UI端口查看
打开端口:http://master:8080,看到下面的界面表示成功:
实时流处理框架之Storm的安装与部署

0xFF 总结
  1. Flume、Kafka、Storm的综合小案例,请留意后期教程
  2. 后期教程还会加上Kafka、Storm、Kafka的piplines的实现教程

作者简介:邵奈一
全栈工程师、市场洞察者、专栏编辑
公众号、微博、CSDN邵奈一
本系列课均为本人:邵奈一原创,如转载请标明出处

福利:
邵奈一的技术博客导航

 

上一篇:常见的中间件


下一篇:架构解密从分布式到微服务:深入Kubernetes微服务平台