命令行搞一切之如何使用命令行为 redis 做健康检测

如何使用命令行检查 redis 是否按预期工作?

redis-cli 基础知识

使用 redis-cli 检查数据库健康状况听起来很简单,实际上,它是:Redis 主机上的简单redis-cli PING返回PONG。这看起来不太行的样子,但确实如此。返回PONG 的redis功能正常、身体健康,吃嘛嘛香。

更详细一点:这意味着数据集已完全加载,Redis 已准备好连接。如果某些东西不能正常工作,它会显示错误消息,例如“(error) LOADING Redis is loading the dataset in memory”。这将在加载 rdb/aof 文件或等待复制完成时返回。

通过使用 redis-cli,您可以轻松使用info命令和子命令来获取更多统计信息和信息。

命令列表

要重复命令,您可以轻松使用两个选项进行监控:redis - cli - r 5 - i 2 <command> 将执行<command> 5 次,间隔为 2 秒。

使用这些命令,您可以轻松地将 redis 集成到您的监控中。只需将 redis-cli 命令添加为自定义参数,例如添加到 Zabbix 或 Nagios。您还可以使用 prometheus 导出器从 redis 中获取指标。

集成延迟监控、报告、慢日志

也许你们中的一些人会问自己,为什么我们首先需要监控,因为 redis 的速度非常快。答案是:您说得对,redis 旨在为每个实例每秒处理大量查询。但不幸的是,在大多数应用程序中,对平均响应时间和最坏情况的延迟都有严格的要求。

尽管如此,因为 redis 有大量的命令,多且杂,也分为三六九等。有些命令运行速度很快,而且运行速度为常数或对数时间,而其他命令则较慢,可能会导致延迟峰值。采用这种监控方式的其他原因是与操作系统的交互(例如磁盘持久性)和 redis 的单线程架构有关。

自2.8.13版本起,redis 引入延迟监控,该命令有助于解决可能的延迟问题。以下机制是该框架的一部分:

  • 用延迟钩子来采样不同延迟敏感代码的路径
  • 由其他事件分割的延迟峰值的时间序列记录
  • 报告引擎从时间序列中获取原始数据
  • 分析引擎根据测量提供人类可读的报告和给出相应提示

如何启用延迟监控?

在 redis 运行时,延迟监控可以很容易地通过 CONFIG SET latency-monitor-threshold 100启用。尾数以毫秒为单位定义时间。在我们的示例中,每个需要超过 100ms 的事件都将被记录为延迟峰值。

使用 LATENCY 命令报告信息

延迟监控子系统的用户界面是LATENCY命令。像许多其他 Redis 命令一样,LATENCY接受修改其行为的子命令。这些子命令是:

  • LATENCY LATEST - 返回所有事件的最新延迟样本。
  • LATENCY HISTORY - 返回给定事件的延迟时间序列。
  • LATENCY RESET - 重置一个或多个事件的延迟时间序列数据。
  • LATENCY GRAPH - 呈现事件延迟样本的 ASCII 艺术图。
  • LATENCY DOCTOR - 回复人类可读的延迟分析报告。

有关详细信息,请参阅每个子命令的文档页面

当 redis 遇到延迟峰值时我该怎么办?

下一步可能是启用慢日志。配置命令为 config set slowlog-log-slower-than 1000, 您可以记录每一个持续时间更长,超过1000ms的事件。

上一篇:D炸天的Redis,该如何监控?


下一篇:Prometheus 精要(一)