如何使用命令行检查 redis 是否按预期工作?
redis-cli 基础知识
使用 redis-cli 检查数据库健康状况听起来很简单,实际上,它是:Redis 主机上的简单redis-cli PING
返回PONG
。这看起来不太行的样子,但确实如此。返回PONG
的redis功能正常、身体健康,吃嘛嘛香。
更详细一点:这意味着数据集已完全加载,Redis 已准备好连接。如果某些东西不能正常工作,它会显示错误消息,例如“(error) LOADING Redis is loading the dataset in memory”。这将在加载 rdb/aof 文件或等待复制完成时返回。
通过使用 redis-cli,您可以轻松使用info
命令和子命令来获取更多统计信息和信息。
命令列表
要重复命令,您可以轻松使用两个选项进行监控:redis - cli - r 5 - i 2 <command>
将执行<command>
5 次,间隔为 2 秒。
使用这些命令,您可以轻松地将 redis 集成到您的监控中。只需将 redis-cli 命令添加为自定义参数,例如添加到 Zabbix 或 Nagios。您还可以使用 prometheus 导出器从 redis 中获取指标。
集成延迟监控、报告、慢日志
也许你们中的一些人会问自己,为什么我们首先需要监控,因为 redis 的速度非常快。答案是:您说得对,redis 旨在为每个实例每秒处理大量查询。但不幸的是,在大多数应用程序中,对平均响应时间和最坏情况的延迟都有严格的要求。
尽管如此,因为 redis 有大量的命令,多且杂,也分为三六九等。有些命令运行速度很快,而且运行速度为常数或对数时间,而其他命令则较慢,可能会导致延迟峰值。采用这种监控方式的其他原因是与操作系统的交互(例如磁盘持久性)和 redis 的单线程架构有关。
自2.8.13版本起,redis 引入延迟监控,该命令有助于解决可能的延迟问题。以下机制是该框架的一部分:
- 用延迟钩子来采样不同延迟敏感代码的路径
- 由其他事件分割的延迟峰值的时间序列记录
- 报告引擎从时间序列中获取原始数据
- 分析引擎根据测量提供人类可读的报告和给出相应提示
如何启用延迟监控?
在 redis 运行时,延迟监控可以很容易地通过 CONFIG SET latency-monitor-threshold 100
启用。尾数以毫秒为单位定义时间。在我们的示例中,每个需要超过 100ms 的事件都将被记录为延迟峰值。
使用 LATENCY 命令报告信息
延迟监控子系统的用户界面是LATENCY命令。像许多其他 Redis 命令一样,LATENCY接受修改其行为的子命令。这些子命令是:
- LATENCY LATEST - 返回所有事件的最新延迟样本。
- LATENCY HISTORY - 返回给定事件的延迟时间序列。
- LATENCY RESET - 重置一个或多个事件的延迟时间序列数据。
- LATENCY GRAPH - 呈现事件延迟样本的 ASCII 艺术图。
- LATENCY DOCTOR - 回复人类可读的延迟分析报告。
有关详细信息,请参阅每个子命令的文档页面
当 redis 遇到延迟峰值时我该怎么办?
下一步可能是启用慢日志。配置命令为 config set slowlog-log-slower-than 1000
, 您可以记录每一个持续时间更长,超过1000ms的事件。