请问一下 TiDB_monitor_time_jump_back_error
这个监控项的单位是?
看官方文档并没有明确给出这个值的单位
默认是 >0就报警,
这个值是否建议调整,比如某些场景调整为1.5 或者2
Mark
我看的6.1版本没有这个指标,这个应该是指的是:tidb_monitor_time_jump_back_total 这个指标项吧。
看这个指标项对应得代码定义:
TimeJumpBackCounter = prometheus.NewCounter(
prometheus.CounterOpts{
Namespace: “tidb”,
Subsystem: “monitor”,
Name: “time_jump_back_total”,
Help: “Counter of system time jumps backward.”,
})
意思是:Counter of system time jumps backward.
看这个指标项的埋点所在:
代码这里清晰的说明了每100毫秒检测一次,如果发现你的系统时间被往后调了(调慢了100ms以上),那么就会被tidb_monitor_time_jump_back_total 这个指标计数+1.
因此只要时间>0就报警是没问题的,不需要其它调整。
但是我这里也有一个疑问,假设用时钟同步,当前机器的时间变快了就是需要调整慢100ms以上呢,这个告警怎么解除呢?
感觉描述很清楚了。如果10分钟内机器时间出现差异,就会报错。