集群中的某台TIKV节点感觉异常不知道如何排查

【 TiDB 使用环境】生产环境
【 TiDB 版本】V8.1.0
【复现路径】无,正常生产环境数据的增删改查
【遇到的问题:问题现象及影响】
1.192.168.2.243这台服务器的TIKV感觉有异常,但不知道如何排查,下面有一些监控截图
2.数据库在使用的时候发现TRUNCATE某一些表非常慢,要2个小时,但是新建一张表A,插入一些数据后TRUNCATE A表又很快
【资源配置】

【附件:截图/日志/监控】



admin show ddl jobs看看卡住时候执行状态
另外混合部署注意内存使用量控制,你需要加参数限制组件内存

看你的图,243的cpu低,region数少一些。你通过 pd-ctl 看看这个 store 的评分怎么样,是不是因为磁盘空间之类的因素调度上去的 region 少一些。
另外看内存,243这台机器的内存比其他节点高,能单独看看各个 tikv 之间的内存占用情况吗?

你先看下storage.block-cache.capacity这个值设置多少
SHOW config WHERE NAME LIKE ‘%storage.block-cache.capacity%’;

在truncate的时候,检查tikv节点的I/O利用率,确认是否有I/O瓶颈。也可以使用pd-ctl命令检查Region的状态,确认是否有Region处于不可用状态或Leader缺失,region的健康度。也建议检查下tikv的日志,分析是否有异常错误或警告信息

https://docs.pingcap.com/zh/tidb/v8.3/metadata-lock#元数据锁

参考这个查下,元数据锁会阻塞 DDL