tidb写入慢，发现了几个异常指标求优化办法

TiDBer_freGslX6 · 2023 年11 月 24 日 06:51

【 TiDB 使用环境】生产环境
【 TiDB 版本】v4.0.14
【遇到的问题：问题现象及影响】今天发现有个任务写入有堆积查看监控有几个指标异常，麻烦大佬指点下怎么优化

gRPC poll CPU使用率达到了200%

像风一样的男子 · 2023 年11 月 24 日 07:10

优化这么多其实还不如升级下版本，我之前用的4.0.9很多insert慢，升级后性能提升非常大，基本在慢查询看不到insert

TiDBer_freGslX6 · 2023 年11 月 24 日 07:12

你升级到哪个版本了呀现在迭代太快了我反而不敢升

像风一样的男子 · 2023 年11 月 24 日 07:13

去年从4.0.9升到5.4.3了迭代是快，现在没动力升级了

TiDBer_freGslX6 · 2023 年11 月 24 日 07:15

看了下文档升级很简单你在升级的时候没踩坑吧

Hacker007 · 2023 年11 月 24 日 07:15

你们升级是直接升级还是重新建一个集群然后同步数据过去？

Jellybean · 2023 年11 月 24 日 08:35

两个方式都可以实现升级

具体看你们的业务重要程度，最稳妥的方法就是两个集群主从切换

路在何chu · 2023 年11 月 24 日 10:25

低版本通过cdc同步到高版本。这样升级吗

andone · 2023 年11 月 24 日 10:33

建议升级一下版本

Jellybean · 2023 年11 月 24 日 14:13

是的，我们做过好多次4.0到5.4的升级，都是cdc主从同步然后切换升级。

原地升级也做过不少，两种方式都可行

像风一样的男子 · 2023 年11 月 25 日 00:46

我半夜升级的， --force升级的，不加–force需要每个kv驱离leader非常慢，但是前提是你要测试过各个方面没问题再升级

像风一样的男子 · 2023 年11 月 25 日 00:46

直接升级啊，4.0升到5.4测试过没问题才直接升的

Hacker007 · 2023 年11 月 25 日 01:37

我目前tidb是5.2，dm是2.06,之前在测试试过升级，dm数据同步异常，异常后降级也降不了，现在也不敢升级，要不然出问题老板得坐我旁边上班

像风一样的男子 · 2023 年11 月 25 日 02:03

稳定运行、没特殊需求就别升级。

Kongdom · 2023 年11 月 25 日 09:27

确实，我们有个集群升级后，ddl执行特别快

dba远航 · 2023 年11 月 26 日 00:57

新版本䏌会解决原来很多BUG

春风十里 · 2023 年11 月 26 日 15:12

13点30分后 Command* Per Second 增加，QPS增加， Duration减少。
感觉是突然增加了大量的小SQL执行，导致IO使用率增加，不一定是慢SQL，因为慢SQL一般比较大。大量的小SQL同样有较大危害，可以看看这段时间的小SQL执行频率大量增加的是什么？

Duration：执行时间
- 客户端网络请求发送到 TiDB，到 TiDB 执行结束后返回给客户端的时间。一般情况下，客户端请求都是以 SQL 语句的形式发送，但也可以包含 COM_PING、COM_SLEEP、COM_STMT_FETCH、COM_SEND_LONG_DATA 之类的命令执行时间
- 由于 TiDB 支持 Multi-Query，因此，可以接受客户端一次性发送多条 SQL 语句，如 select 1; select 1; select 1;。此时，统计的执行时间是所有 SQL 语句执行完之后的总时间
Command Per Second：TiDB 每秒处理的命令数。按照执行结果成功或失败来统计
QPS：所有 TiDB 实例上的每秒执行的 SQL 语句数量。按 SELECT、INSERT、UPDATE 类型进行了区分

dba远航 · 2023 年11 月 27 日 00:56

感觉象是网络传输慢造成的异常

zhaokede · 2023 年11 月 27 日 01:10

多观察，是这个表的写入慢，还是特定时间段的写入慢，更进一步定位问题

TiDBer_小阿飞 · 2023 年11 月 27 日 01:14

建议大神们按升级版本整理出来一个文档，比如3-6，4-6之类的