tidb日志持续报:[ERROR] [kv.go:324] ["fail to load safepoint from pd"] [error="context deadline exceeded"]

【 TiDB 使用环境】生产环境
【 TiDB 版本】v8.1.0
【遇到的问题:问题现象及影响】
正式环境启用后dashboard没有异常,集群也可以正常使用,今天查看tidb.log时发现反复在报如下错误:
[ERROR] [kv.go:324] [“fail to load safepoint from pd”] [error=“context deadline exceeded”]


但是不影响正常使用,想求助一下这具体是什么原因?看起来是没法跟pd节点同步时间?两个tidb节点有一个没有这个报错,有一个一直在报这个错。
【资源配置】


三台机器就别部署tiflash了,你tiup cluster display 集群名,看下pd的leader在哪台主机上,看下对应主机的cpu使用率吧先

cpu使用率是很低的,基本上稳定在1%

那两台tidb-server节点到pd leader节点的网络一样,都没问题?

网络确定端口通的,这台失败的节点跟所有的pd节点网络都通的


发现pd的日志报这个错,有没有可能是时钟漂移导致的问题,求助

几个节点之间没做时钟对齐么

那你看下pdleader节点和两个tidb-sever节点的时钟的差异,是不是异常那台差异很大,做一下时钟同步吧

有一台PD的NTP同步失效了,手动执行ntpdate offset时大时小, offset大的时候能有六七秒, 小的时候能有零点几秒。这有没有可能是虚拟机的CPU出问题了呢? :dizzy_face: