在数据库的运维工作中,如果有一种运筹帷幄的感觉,那么其中一种方式就是看报表,比如喝着咖啡缓缓打开电脑,几十台,上百台的机器的负载明细都在眼底。如果某个地方出现了异常或者明显的抖动,在报表中也能够很清晰的显示出来。
目前这种情况还是很难实现,但是我们可以创造,之前的博文中也分析过了zabbix+orabbix的监控方式,还是存在很多亮点,在监控和定制功能上确实很强大,gc功能本身就很强大,但是扩展相对还是比较困难的。
首先我们来show一个概览图,这个是我们努力的目标。比如我们有几十台DB服务器,在开始工作前看看这个报表无疑会让你的工作针对性更强,哪些是需要重点关注的,哪些可能是潜在的问题,哪些问题迫在眉睫需要解决。
比如我们收到了下面的形式的邮件,描述的是4台DB在过去的24个小时内的等待事件,是不是相对来说感觉要清晰一些,当然我们还可以扩展其它的监控项。
要实现这个效果,着实不是一件容易的事情。
自己也是各方找了各种资料,也是在不断的失败经历中总算看到了一丝曙光。
首先要通过zabbix得到这个图片,大体的原理如下:
要得到一个基本的图形,除了基本指定长宽之外,最主要的就是graphid和screenid这两个属性
orabbix会把数据通过Jdbc得到后传给zabbix中的mysql表中,当需要取得对应的数据信息时,通过图形的方式还是要依赖screenid和graphid,在对应的表中进行关联得到数据的变化情况。
明白了基本原理,我们为了实现发送邮件中嵌入图形的需求,就需要把这些图形以附件的形式发送邮件。
按照这个思路还是有几件必须要完成的事情,
1.知道screenid和graphid和mysql表的关联关系
2.利用screenid和graphid得到对应的报表图片
3.把图形存储在临时目录下
4.把图形以附件的形式发送。
第1步从网络中也会得到一些基本的信息,如果想得到更多的明细信息,似乎资源也有限,从我的实验来看,表关联关系和网络还是存在一定的差别,最后我是根据几个关联表的数据反复比较,最后也算是找出了规律,后面详细介绍表关联关系的细节。
第2步通过screenid和graphid得到对应的报表图片,这个步骤是基于第1步,我们可以做基本的测试,得到图片的url格式,然后把一些非必须字段,比如长宽等给定一个默认值即可。
第3步需要把图片能够下载下来存放在临时目录下,这个过程还是需要借助脚本来完成,这方面python的强大的web功能就派上了用场。可以基于根据url下载图片,然后把图片放入web服务器的默认路径下,比如/var/www/zabbix/reports
第4步就是借用邮件发送的功能来把图片放入附件中,这个部分还是使用python来做,把步骤3,步骤4的功能都独立成对应的功能点。
看起来各个功能还是紧密关联的,但是我们可以把它拆分开来,比如我们可以直接实现第4步,模拟我们收到了图片的场景即可。
得到图片graphid和screenid的部分,我们可以在已有的监控图中查看属性得到一个url样例,然后按照这个格式来进行修改定制。
如果实现得都差不多了,再回到第一步来解析数据字典也不迟。解析数据字典的比偶关联有点懵懵懂懂,压根没有datamodel之类的详细文档,好在开源项目的表结构还是很清晰,还是能够基本看出字段,表名的含义,比较清晰,侥幸解析出来了关联关系。
详细的步骤在第二篇中进行分析。