redis5.0排查latency问题

生产环境20个节点规模采用redis5.0自带的cluter方案的redis集群,偶尔出现尖刺。

经过排查,排除网络波动影响(网络是正常的),随即将redis自带的latency监控打开(latency监控默认处于关闭状态)

redis5.0排查latency问题

 

过了一段时间,发现服务又有尖刺,这时去查看redis latency监控,发现如下:

redis5.0排查latency问题

 

从上图看出,都是由于AOF持久化导致的问题,但redis生产集群采用的都是appendfsync everysec策略,考虑了下修改一下no-appendfsync-on-rewrite 参数试下,原因是aof rewrite的时候产生的大量I/O操作导致redis主线程appendfsync阻塞,遂将no-appendfsync-on-rewrite由默认的no修改成yes ,即aof rewrite的时候不进行appendfsync,且观察观察再说。