用ELK打造可视化集中式日志

Elk是Elastic search, Logstash和Kibana三者的简称。

Elastic search顾名思义是致力于搜索,它是一个弹性搜索的技术平台,与其相似的有Solr,二者的对比可参考下面这篇文章:
Elastic search与Solr选型

总结一下就是,如果你不喜欢夜店咖还是喜欢忠实可靠的老婆,那选Elastic search准没错,何况他还有那么一点美。目前运用ES的案例也不少了,比如it屌丝们都爱的Git hub以及我D痛恨的Wiki。

Logstash,也可以顾名思义一下,stash的意思是藏匿处,所以……其实并不完全准确,Logstash是用来做日志采集,藏匿几乎就不由他管了,藏匿由谁管呢,聪明的看官肯定能猜到是ES了。但是这也不完全准确,在ELK的运维环境中肯定是ES没跑了,不过Logstash支持各种输出源,包括redis,s3,mongodb以及kafka,甚至对于情怀粉(不嘛,人家就喜欢刺刀,不要枪炮,拼刀才爷们)吧,还贴心的支持http的远程写文件方案。总之我们能想到的,作者也想到了,我们没能想到的,作者也想到了,如果有作者没能写到的,那也没关系,你可以自己写插件。什么?你写不出来?写不出来就不要瞎bb,找个现成能用的。相对应的,ES也支持各种输入源,从基本的stdin到file到redis到……

Kibana,呃,羔羊肉饼。估计作者是个洋鬼子北京情怀蜜吧,代码写多了,看着掉了一地的头发,想着要是能吃份东来顺的铜锅涮羊肉多好,然后取了这鬼名字吧。Kibana主要是用于ES分析和查询。Elk里本来完全可以不用带他的,用用ES的head和bigdesk插件也蛮好,不过Kibana的管理和查询用起来确实方便很多,人嘛,有枪炮用何必非要用刺刀,默默想到楼主的前东家。

用ELK打造可视化集中式日志
那个奶妈形态的德鲁伊就是Logstash,agent只是Logstash承担的一个角色,与此对应的是indexer。agent会分别将各自获取的日志作为输入输出到一个消息代理(例如redis或者kafka),indexer会将消息代理作为输入再输出到ES上,由ES做indexing。其实Logstash在整个过程中只负责输入输出,对Logstash而言并没有agent和index之分。如果日志量小的话完全不需要设置indexer,直接将ES作为agent的输出源。

Elastic search

环境准备:
Jdk7及以上,Logstash2.1明确只支持Jdk7。
Elastic search, Kibana, Logstash下载地址
ES不能以root权限启动。

楼主的环境;
10.0.250.90 9200 9300
10.0.250.90 9201 9301
10.0.250.90 9200 9300
第一个端口是对外提供http服务的接口,第二个端口是集群交换协议的端口。

cd /opt/elasticsearch-2.1.0/config
vim elasticsearch.yml

以10.0.250.90 9200 9300为例。
修改集群名称,ES默认通过广播发现节点,所有在广播里声明为同一个集群名称的节点都会被自动加入集群中。

cluster.name: es

设置节点名称

node.name: es-node-2

````
此外可以通过node.master设置节点是否可以被推举为leader以及node.data设置节点是否保存索引数据。

节点的定制化属性信息,我把三个节点设成r1-r3




<div class="se-preview-section-delimiter"></div>

node.rack: r2

数据存储目录




<div class="se-preview-section-delimiter"></div>

path.data: /usr/local/data/

日志目录,默认生成的日志文件是${cluster.name}_xxx,可以通过logging.yml修改




<div class="se-preview-section-delimiter"></div>

path.logs: /var/log/es/

启动时是否就锁住内存,es是基于java,遵循java的内存回收,java内存分配一般会设定一个最小值(-Xms)和一个最大值(-Xmx),这样虽然能在空闲时节约内存,但是却会带来频繁的gc。所以es建议在启动时就锁定内存,并且es建议将主机一半可用内存分配给它。




<div class="se-preview-section-delimiter"></div>

bootstrap.mlockall: true

绑定网络地址,默认是127.0.0.1。可以通过transport.tcp.port设置项设置几圈交换协议的端口。




<div class="se-preview-section-delimiter"></div>

network.host: 10.0.250.91
http.port: 9200

1. 设置初始化时的发现列表,新节点会通过单播的方式发现列表里的节点。
2. 设置有master资格的节点最小个数,低于这个个数可能会发生脑裂。es建议的个数是所有节点数/2+1。
所谓脑裂是指集群中有多个active的master节点,这样就导致多个节点接管集群服务。举个例子:
假设A,B,C三个节点都有master资格,A节点为active,其他未standby,但是A节点出了故障,这时B,C就要进行投票选出新的leader,此时的结果就可能会是B和C都互有两票,量个节点都分别active。
这里只是描述脑裂成因,和ES的脑裂成因并不完全一样,ES的投票机制应该是类似于redis先到先得的那种。不过配置上最好遵从es的建议。




<div class="se-preview-section-delimiter"></div>

discovery.zen.ping.unicast.hosts: [“10.0.250.90:9300”, “10.0.250.91:9300”]
discovery.zen.minimum_master_nodes: 2

配置完以后,启动elastic




<div class="se-preview-section-delimiter"></div>

bin/elasticsearch
curl http://10.0.250.91:9200
curl http://10.0.250.91:9200/_nodes

通过curl命令查看下节点状态以及整个集群的节点状态。

推荐安装head插件,可以查看集群状态




<div class="se-preview-section-delimiter"></div>

bin/plugin install mobz/elasticsearch-head

bigdesk插件在当前版本上无法使用,因为ES通过Rest接口返回的json数据不标准,jquery会出parse错误。

通过浏览器访问http://10.0.250.91:9200/_plugin/head
![节点状态](http://img.blog.csdn.net/20151226175252443)




<div class="se-preview-section-delimiter"></div>

## Kibana ##
Kibana的安装也很简单,下载最新版本并安装。
我安装在251主机上。




<div class="se-preview-section-delimiter"></div>

vim config/kibana.yml

设置Kibana端口





<div class="se-preview-section-delimiter"></div>

server.port: 5601


设置提供rest查询服务的ES节点,设置了后Kibana就会通过这个节点查询信息了。




<div class="se-preview-section-delimiter"></div>

elasticsearch.url: “http://10.0.250.90:9200

设置Kibana自用索引,主要用来存储Kibana保存的一些内容,例如查询信息,报表等




<div class="se-preview-section-delimiter"></div>

kibana.index: “.eslogs”

启动Kibana




<div class="se-preview-section-delimiter"></div>

bin/kibana

访问Kibana,第一次使用时会让你建logstash的索引规则,默认为logstash-*,*代表日期,每天会生成一个新的索引。




<div class="se-preview-section-delimiter"></div>

## Logstash ##
Logstash的安装非常简单,下载最新版本并安装,我用的是2.1.1.




<div class="se-preview-section-delimiter"></div>

bin/logstash -e ”

-e ''会默认以stdin作为输入,以stdout作为输出。
我在控制台输入11111,控制台就输出了格式化的输出。




<div class="se-preview-section-delimiter"></div>

11111
{
“message” => “11111”,
“@version” => “1”,
“@timestamp” => “2015-12-26T10:00:23.422Z”,
“type” => “stdin”,
“host” => “0.0.0.0”
}

接着,我们再测试一下以ES作为输出源,在ES根目录下:




<div class="se-preview-section-delimiter"></div>

mkdir config
touch logstash-indexer.conf
vim logstash-indexer.conf

修改logstash-indexer.conf定义输入源为stdin,输出为stdout以及ES.




<div class="se-preview-section-delimiter"></div>

input {
stdin{
type=> “stdin-input”
}
}
output {
stdout { codec=> rubydebug }
elasticsearch {
hosts=> [“10.0.250.90:9200”]
codec=> “json”
}
}

启动Logstash




<div class="se-preview-section-delimiter"></div>

bin/logstash -f config/logstash-indexer.conf -l /var/log/logstash/logstash.log
“`
输入“hello this a test message”然后回车
用ELK打造可视化集中式日志
在Kibana那就能看到对应的日志信息
用ELK打造可视化集中式日志

上一篇:spring-session源码解读-3


下一篇:spring-session源码解读-4