Trino查询Tidb出现以下错误

【 TiDB 使用环境】生产环境 /测试/ Poc
生产环境
【 TiDB 版本】
6.0.1
【复现路径】做过哪些操作出现的问题
Trino查询tidb
【遇到的问题:问题现象及影响】

display 看一下集群状态。


又出现一个新的报错

集群状态目前我还看不到,可能要等运维来了之后让运维看,前几天升级了一次tidb的集群,然后现在的情况是,部分表能查得出来,部分表会出现上述的情况

突然又都能查了,,,太奇怪了

tidb用的是6.0.1版本

怀疑 tikv 挂了,有数据损坏,需要看下具体集群状态。


昨天是0点16分查询出的问题,然后tikv在0点31分有一次重启,早上我是9点12分查询失败,但是在9点12分到9点27分之前有出现部分语句查询成功部分语句查询失败的情况,然后tikv在9点27分有过一次重启,感觉时间点对不上

详细查看一下tidb,与tikv 的日志,确定一下故障原因。恢复的时候,备份一下数据, 尝试把这台KV缩容掉重新扩容一台。

问了下运维,重启是因为发生了oom

运维说好像是页大小不足


找了下更详细的日志

你这个 region 数量有点多,最后改下心跳和开启 region merge 和跨表 region merge。

如果发现 merge 不过来 你需要调大调度相关和 merge 相关参数。

哦哦好的,但是我这边好像报的是leader找不到的问题。。好奇怪

找不到可能是发生了调度,你先按照我的建议 对 tikv 降压,心跳过多是一个问题。