重启某个TIKV节点报错

【TiDB 使用环境】生产环境
【TiDB 版本】5.2.3
【操作系统】

【部署方式】云上部署(什么云)/机器部署(什么机器配置、什么硬盘)
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】

按找提示看下tiup,tikv的日志,报的什么错

感觉没看出啥问题

tikv的日志呢,看看tikv启动时间的日志,重启的话不应该出现网络等问题

这个能看出啥问题吗

image


这个能看出啥嘛

这应该是数据有问题,你是正常停止的么

这台机器 假死了 我用了 tiup cluster stop tidb-cluster -N 10.11.0.12:20160的命令

假死的话可能数据已经损坏了,正常是没有办法恢复的,你可以再启动下,如果还是相同的问题就采用扩缩容处理吧,先扩容一个tikv吧

也不是说假死 就是连接数 突然上升 了 系统卡住了

把你的拓扑和损坏机器上的组件发下吧,然后看下对应的机器的dmesg -T,看看对应的时间有没有信息

什么组件 是目录吗

就是你当前tikv所在机器是混布的么,都有哪些组件(pd,tidb,tikv…),tikv所在机器的dmesg -T能看到什么信息么,对应时间有没有什么报错信息

dmesg -T 这个只到6月份

那应该不是机器的原因了,让机房检查下磁盘是不是有问题吧,当前tikv的问题就是某些原因导致了数据损坏,某些提交数据出了问题,你启动启不起来的话就扩容再缩容挂掉的kv节点吧

意思再弄一台机器 把挂的下线掉是吗