使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况

使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况

前言

本文在Debian9下采用Docker的方式安装Telegraf + Influxdb + Grafana对服务器进行监控。
首先我们需要在一台Server上安装Debian9作为监控主机,这个监控主机可以配置为可监控多台Server。

安装Docker

如果之前已经安装过旧版本的Docker,先移除旧版本的安装

sudo apt-get remove docker docker-engine docker.io containerd runc

更新apt-get

sudo apt-get update

安装依赖项

    sudo apt-get install \
    apt-transport-https \
    ca-certificates \
    curl \
    gnupg2 \
    software-properties-common

添加Docker的GPG key,命令执行成功后会显示一个OK

curl -fsSL https://download.docker.com/linux/debian/gpg | sudo apt-key add -

添加Docker的apt-get源

sudo add-apt-repository \
   "deb [arch=amd64] https://download.docker.com/linux/debian \
   $(lsb_release -cs) \
   stable"

更新apt-get源

sudo apt-get update

安装Docker

sudo apt-get install docker-ce docker-ce-cli containerd.io

验证Docker是否安装成功

sudo docker run hello-world

执行以上的命令将会从服务器上拉取hello-world的docker镜像,然后再运行,如果看到Hello from Docker!的字样代表安装成功。
安装Docker-compose

sudo curl -L "https://github.com/docker/compose/releases/download/1.24.0/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

修改权限

sudo chmod +x /usr/local/bin/docker-compose

检查是否安装成功

root@TRPG:/opt/monitoring# docker-compose --version
docker-compose version 1.24.0, build 0aa59064

安装Docker镜像

新增一个用于安装的目录

mkdir /opt/monitoring && cd /opt/monitoring

为InfluxDB和Grafana创建一个配置文件docker-compose.yml,内容如下

version: "2"
services:
  grafana:
    image: grafana/grafana
    container_name: grafana
    restart: always
    ports:
      - 3000:3000
    networks:
      - monitoring
    volumes:
      - grafana-volume:/var/lib/grafana
  influxdb:
    image: influxdb
    container_name: influxdb
    restart: always
    ports:
      - 8086:8086
    networks:
      - monitoring
    volumes:
      - influxdb-volume:/var/lib/influxdb
networks:
  monitoring:
volumes:
  grafana-volume:
    external: true
  influxdb-volume:
    external: true

以上配置文件为Influxdb和Grafana配置了相同的网络,同时分别为他们配置了外部存储区域,外部存储的好处是可以避免Docker重启时数据和配置文件丢失。
创建Dokcer的网络和外部存储

docker network create monitoring
docker volume create grafana-volume
docker volume create influxdb-volume

使用一下命令查看是否建立成功

kevin@TRPG:/opt/monitoring# docker network ls
NETWORK ID          NAME                DRIVER              SCOPE
21e7cf397dda        bridge              bridge              local
130831cce642        host                host                local
f58bbb798bea        monitoring          bridge              local
a285f4ff4c69        none                null                local
kevin@TRPG:/opt/monitoring# docker volume ls
DRIVER              VOLUME NAME
local               grafana-volume
local               influxdb-volume

如果可以看到我们创建的网络及存储后,就可以开始拉取Influxdb的镜像,当中包含一些参数及用户名和密码

docker run --rm \
  -e INFLUXDB_DB=telegraf -e INFLUXDB_ADMIN_ENABLED=true \
  -e INFLUXDB_ADMIN_USER=admin \
  -e INFLUXDB_ADMIN_PASSWORD=supersecretpassword \
  -e INFLUXDB_USER=telegraf -e INFLUXDB_USER_PASSWORD=secretpassword \
  -v influxdb-volume:/var/lib/influxdb \
  influxdb /init-influxdb.sh

使用docker-compose启动

docker-compose up -d

检查是否运行成功

kevin@TRPG:/opt/monitoring# docker ps
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS              PORTS                    NAMES
ddc05619ab66        grafana/grafana     "/run.sh"                47 seconds ago      Up 46 seconds       0.0.0.0:3000->3000/tcp   grafana
73efef324306        influxdb            "/entrypoint.sh infl…"   47 seconds ago      Up 45 seconds       0.0.0.0:8086->8086/tcp   influxdb

以上,Influxdb和grafana都安装和启动成功,从上面的信息可以看到Influxdb使用端口tcp 8086,Grafana使用端口tcp 3000,在浏览器打开IP:3000就可以看到Grafana的登录界面了,默认的用户名及密码都是admin,首次登陆后会提示修改密码。
登录到Grafana后,选择Add datasource ,类型选择InfluxDB,配置界面如下图
使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况

URL的部分输入的influxdb是表示之前创建的镜像名称,因为两个镜像共用了同一个网络,因此可以使用网络发现的功能,然后下面的Save & Test按钮测试配置是否成功。

在需要收集数据的服务器上安装Telegraf

到以下地址下载Telegraf的windows版本。
将下载所得文件解压缩。

将Telegraf安装为Windows服务

切换到Telegraf的存放目录下,执行一下命令安装至Windows 服务

telegraf.exe --service install

此时Telegraf的服务状态还是出于停止的状态

配置Telegraf收集相关数据

在数据库中创建Telegraf的登录用户

USE master;
GO
CREATE LOGIN [telegraf] WITH PASSWORD = N'mystrongpassword';
GO
GRANT VIEW SERVER STATE TO [telegraf];
GO
GRANT VIEW ANY DEFINITION TO [telegraf];
GO

修改配置文件如下

[[outputs.influxdb]]
  urls = ["http://192.168.0.207:8086"]

  ## The target database for metrics; will be created as needed.
  database = "telegraf"
  
  retention_policy = ""
  
  write_consistency = "any"

  ## Timeout for HTTP messages.
  timeout = "5s"

  ## HTTP Basic Auth
  username = "telegraf"
  password = "password"
 # Read metrics from Microsoft SQL Server
 
[[inputs.sqlserver]]
  ## Specify instances to monitor with a list of connection strings.
  ## All connection parameters are optional.
  ## By default, the host is localhost, listening on default port, TCP 1433.
  ##   for Windows, the user is the currently running AD user (SSO).
  ##   See https://github.com/denisenkom/go-mssqldb for detailed connection
  ##   parameters.
  servers = [
    "Server=127.0.0.1;Port=1433;User Id=telegraf;Password=leecasjamhtkale;app name=telegraf;log=1;",
  ]

  ## Optional parameter, setting this to 2 will use a new version
  ## of the collection queries that break compatibility with the original
  ## dashboards.
  query_version = 2

  ## If you are using AzureDB, setting this to true will gather resource utilization metrics
  # azuredb = false

  ## If you would like to exclude some of the metrics queries, list them here
  ## Possible choices:
  ## - PerformanceCounters
  ## - WaitStatsCategorized
  ## - DatabaseIO
  ## - DatabaseProperties
  ## - CPUHistory
  ## - DatabaseSize
  ## - DatabaseStats
  ## - MemoryClerk
  ## - VolumeSpace
  exclude_query = [ 'DatabaseIO', 'PerformanceCounters', 'WaitStatsCategorized', 'DatabaseProperties', 'CPUHistory', 'DatabaseSize', 'DatabaseStats', 'MemoryClerk', 'VolumeSpace' ]

测试是否连接成功

telegraf.exe --config telegraf_sql.conf -test

另外可至GITHUB下载Grafana的配置文件和对应的telgraf配置文件
最终结果如下图
使用Telegraf + Influxdb + Grafana 监控SQLserver服务器的运行状况

上一篇:influxdb 全家桶运行


下一篇:线程、并发相关基础知识