TiKV宕机后重启，注册pd失败

Lawrence · 2021 年9 月 28 日 02:41

【 TiDB 使用环境】
【概述】：场景 + 问题概述
有一台tikv宕机了，重启机器后，tikv开始OOM和无限重启

【背景】：做过哪些操作
一台tikv宕机，重启机器后，tikv起不来

【现象】：业务和数据库现象
tikv 宕机，dmesg 显示oom

【问题】：当前遇到的问题
tikv 无法提供服务

【业务影响】：
生产一台tikv无法工作，无限重启

【TiDB 版本】：
5.0.3

【附件】：

相关日志
tikv-little.tar.gz (2.2 MB)
dmesg.tar.gz (120.2 KB)

image982×730 33.9 KB
Grafana 监控（https://metricstool.pingcap.com/)[dmesg.tar.gz|attachment]

image930×403 51.7 KB

xfworld · 2021 年9 月 28 日 02:52

你的配置能补充下么？

Lawrence · 2021 年9 月 28 日 02:55

然后现在又开始报这个错误了：
[ERROR] [server.rs:880] [“failed to init io snooper”] [err_code=KV:Unknown] [err=“"IO snooper is not started due to not compiling with BCC"”]

磁盘空间是够的

xfworld · 2021 年9 月 28 日 03:03

硬件配置呢？

Lawrence · 2021 年9 月 28 日 03:59

9台机器，3台pd+tidb，3台tikv，3台tiflash，这3台tikv配置是8C/16G，该集群正常跑了2个月左右，宕机原因我们大致清楚，当时有通过jdbc100并发写入，27节点tikv宕机重启，持续了近两个小时，服务器也直接宕机了，把服务器起来后，tikv启动就开始报这个错了，现在没有数据写入了，27这个节点还是起不来，我们想先解决问题，先能够正常起起来