TiDB 的问答社区

pd集群重搭后经常 pd server out

🪐 TiDB 技术问题部署&运维管理

songxuecheng (小白) 2022 年11 月 17 日 14:20 164

force 强制重启或者修改timeout

kuuhaku (kuuhaku) 2022 年11 月 17 日 14:34 165

reload xxx --force 这样？

songxuecheng (小白) 2022 年11 月 18 日 00:27 166

–transfer-timeout xxx
region多就设置时间长一些最好不用force

kuuhaku (kuuhaku) 2022 年11 月 18 日 00:57 168

重搭之后目前还没发现 truncate 后的表有问题,但是旧的有数据的表问题查询还是有问题

kuuhaku (kuuhaku) 2022 年11 月 18 日 00:58 169

现在tidb有在报这个错误 [2022/11/18 08:54:58.176 +08:00] [ERROR] [distsql.go:1201] [“table reader fetch next chunk failed”] [error=“[tikv:9001]PD server timeout”]

songxuecheng (小白) 2022 年11 月 18 日 01:09 170

先确定之前的问题是否已经解决？
按照道理现在新增表应该不会有问题。
你之前的表。由于alloc id问题。可能还是会有问题

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:12 171

昨晚到现在truncate 后新入数据还没问题，目前还在跟踪日志

songxuecheng (小白) 2022 年11 月 18 日 01:15 172

OK。建议有问题的表。就重建吧重新导入数据。
pd 重建，alloc id 最好使用一个比较大的值，一定不能使用比之前小的值。

后续如果还是有问题，使用clinc 发出来再看下。

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:17 173

导入不了呢，

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:18 174

数据就一份旧的查不出来

songxuecheng (小白) 2022 年11 月 18 日 01:21 175

应该是小范围的表有问题吧。这个我这边也没什么好的办法，
之前说的删除索引。重建索引试过了吗

USE information_schema;
DESC tikv_region_status;
查下这个表。看下是否有重复的region id

xfworld (魔幻之翼) 2022 年11 月 18 日 01:26 176

就一个苯办法，赶紧先把数据捞出来
在建一套，把数据导进去，切换就行了~

然后你也可以按照 @songxuecheng 提出的方式，对每个细节进行恢复，比较费劲了…

h5n1 (H5n1) 2022 年11 月 18 日 01:29 177

试试设置tidb_snapshot 或tidb_replica_read = ‘follower’ 能不能读出来

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:32 178

看起来
挺正常的这个

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:32 179

其他办法导出数据不行我就试试这个

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:34 180

数据有点多，环境也有在人用重新搞一套需要时间比就多，目前只能先修复部分

songxuecheng (小白) 2022 年11 月 18 日 01:34 181

分组去重。看看是否有region id 相同超过4个的。

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:37 182

我精准到某张表的查询是这样

songxuecheng (小白) 2022 年11 月 18 日 01:40 183

具体的表去掉，有可能是其他表的region

kuuhaku (kuuhaku) 2022 年11 月 18 日 01:51 184

我跟 STORE_ID 去重是没有超过3个

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号