flume日志收集

1 安装flume

 tar -xvf apache-flume-1.6.0-bin.tar.gz  解压

2   flume 架构

flume:收集传输发送数据,没有存储数据的能力;

source (facebook  本地目录  日志系统   netcat  http 上一个flume)>   channel (memory内存通道  file文件通道  ) >  Sink目的地(hdfs  kafka  avro  本地目录)

flume日志收集

 

 

flume日志收集

3  flume输出

2.1 flume接离线

传输给  分布式HDFS文件系统,以行存储    》再用MapReduce离线批处理 ,需要用java写代码   或者   使用  Hive 类sql  Hql来离线批处理   》  计算结果再存到  HDFS  > 通过Sqoop(ETL)工具把结果数据导入到关系型数据库,供页面用

 

2.2 flume接实时

flume:Storm或者  Spark Streaming 实时计算框架 》 计算结果数据存到HDFS或者HBase或者mysql

 

4 使用工具模拟网络数据输入给flume

4.1  安装 netcat工具,用于发送网络请求给flume

 

rpm  -ivh  nc-11.84-22.el6.x86_64.rpm  

4.2 修改flume如下配置

flume日志收集

 

 flume日志收集

 地址:本地   

输出:控制台   

使用内存通道

4.3 启动netcat

 flume日志收集

 

 ctrl+c  退出netcat

4.4 复制连接在另一个连接上给flume发请求数据

4.4.1 发送方式1

flume日志收集

 

4.4.2 发送方式2

flume日志收集

 

上一篇:在虚拟机中安装mysql【线上安装和离线安装】


下一篇:Linux在线安装JDK1.8