【TiDB 使用环境】生产环境
【TiDB 版本】5.2.3
【操作系统】
【部署方式】云上部署(什么云)/机器部署(什么机器配置、什么硬盘)
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【TiDB 使用环境】生产环境
【TiDB 版本】5.2.3
【操作系统】
【部署方式】云上部署(什么云)/机器部署(什么机器配置、什么硬盘)
【集群数据量】
【集群节点数】
【问题复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
按找提示看下tiup,tikv的日志,报的什么错
感觉没看出啥问题
tikv的日志呢,看看tikv启动时间的日志,重启的话不应该出现网络等问题
这个能看出啥问题吗
这应该是数据有问题,你是正常停止的么
这台机器 假死了 我用了 tiup cluster stop tidb-cluster -N 10.11.0.12:20160的命令
假死的话可能数据已经损坏了,正常是没有办法恢复的,你可以再启动下,如果还是相同的问题就采用扩缩容处理吧,先扩容一个tikv吧
也不是说假死 就是连接数 突然上升 了 系统卡住了
把你的拓扑和损坏机器上的组件发下吧,然后看下对应的机器的dmesg -T,看看对应的时间有没有信息
什么组件 是目录吗
就是你当前tikv所在机器是混布的么,都有哪些组件(pd,tidb,tikv…),tikv所在机器的dmesg -T能看到什么信息么,对应时间有没有什么报错信息
dmesg -T 这个只到6月份
那应该不是机器的原因了,让机房检查下磁盘是不是有问题吧,当前tikv的问题就是某些原因导致了数据损坏,某些提交数据出了问题,你启动启不起来的话就扩容再缩容挂掉的kv节点吧
意思再弄一台机器 把挂的下线掉是吗