Flume参数小结

名词解释:

1、netcat:通过网络端口获取数据,source的实现类

2、logger:将数据显示到控制台,sink的实现类

3、memory: ,channel的实现类

4、capacity:是指channel的最大容量

5、spooldir:本地文件目录(文件夹)用来读取数据(文件)

6、file Header:存取采集数据所在文件的绝对路径,默认为true

7、event:将数据反序列化生成的对象,有两个属性,分别是header 和 body

8、fileSuffix:更改文件后缀名

9、flume在采集数据的时候,会将数据封装成一个event对象,event对象的里面有:header:Map[String,String]属性,还有一个body(数据的本身):byte[ ]属性;

10,kafkaSink:将数据存储到Kafka集群中

11、filePrefix:文件的前缀名

12、exec :执行,exec source 是指命令行的source,可以执行Unix命令

# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1 # Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444 # Describe the sink
a1.sinks.k1.type = logger # Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100 # Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

  

上一篇:ubuntu 16.04+Anaconda+theano+keras安装【转】


下一篇:express框架路由配置及congtroller自动加载