TiKV 莫名重启

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
v5.1.1 生产环境

【概述】 场景 + 问题概述
tikv重启
%E5%9B%BE%E7%89%87
【背景】 做过哪些操作
无任何操作
【现象】 业务和数据库现象

【问题】 当前遇到的问题

【业务影响】

【TiDB 版本】

【应用软件及版本】

【附件】 相关日志及配置信息


  • TiUP Cluster Display 信息
  • TiUP CLuster Edit config 信息

监控(https://metricstool.pingcap.com/)

  • TiDB-Overview Grafana监控
  • TiDB Grafana 监控
  • TiKV Grafana 监控
  • PD Grafana 监控
  • 对应模块日志(包含问题前后 1 小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

监控(https://metricstool.pingcap.com/)

麻烦发一下 TiKV-details 监控看一下


看起来跟上面的 “cop.normal-4 … segfault” 比较相关,是在这之后 TiKV 重启的吗,有相应的 coredump 文件吗?

coredump在哪里?

tidb-cluster-TiKV-Details_2021-09-13T02_22_05.567Z.json (16.5 MB)

楼上说的应该是根因,从 TiKV-details 里面看到的现象应该都是结果。可以参考一下这个帖子 。部分TiKV节点部署目录下出现core命名的二进制格式文件

我没有这个文件 就没办法找原因了?

是的,建议吧 coredump 一下,后面如果有类似问题我们再跟进吧。
现在业务恢复了对吧?

一般是什么原因呢?

有可能是 corner case ,极端场景触发的 bug。目前 5.1.1 在其他线上使用的用户反馈是稳定的,建议打开 coredump 再观察一下。

1赞

ok 我在看看