名词解释:
1、netcat:通过网络端口获取数据,source的实现类
2、logger:将数据显示到控制台,sink的实现类
3、memory: ,channel的实现类
4、capacity:是指channel的最大容量
5、spooldir:本地文件目录(文件夹)用来读取数据(文件)
6、file Header:存取采集数据所在文件的绝对路径,默认为true
7、event:将数据反序列化生成的对象,有两个属性,分别是header 和 body
8、fileSuffix:更改文件后缀名
9、flume在采集数据的时候,会将数据封装成一个event对象,event对象的里面有:header:Map[String,String]属性,还有一个body(数据的本身):byte[ ]属性;
10,kafkaSink:将数据存储到Kafka集群中
11、filePrefix:文件的前缀名
12、exec :执行,exec source 是指命令行的source,可以执行Unix命令
# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1 # Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444 # Describe the sink
a1.sinks.k1.type = logger # Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100 # Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1