TIKV 节点出现异常系统盘读流量，TIKV进程大量 MajorPageFault

北极星DB · 2025 年10 月 24 日 02:57

swap观察下

WalterWj · 2025 年10 月 27 日 02:06

node export 用的不是 tidb 自带的么？

三十柒号 · 2025 年10 月 28 日 01:34

5.0.0的版本，metrics里好像就是没有这个

三十柒号 · 2025 年10 月 28 日 01:34

swap没有使用

万仞听松客 · 2025 年10 月 28 日 01:44

之前多久没重启了

三十柒号 · 2025 年10 月 28 日 02:37

这两天分析了一下tikv的内存分布。发现tikv分配内存会倾向于在numa 的 node1进行分配。95%会在node1 的normal分配，5%会在node0的normal分配。
这个似乎也解释了buddyinfo为啥会看到node1的碎片比node0更加严重。

三十柒号 · 2025 年10 月 28 日 02:39

uptime才3个月

三十柒号 · 2025 年10 月 28 日 12:22

今天发现不是nodeexporter太老了，而是nodeexporter没有开

但是重启了一台tikv，已经恢复了，估计短时间不会再出

TiDBer_xx13 · 2025 年10 月 28 日 13:15

swap未使用呢

awker · 2025 年10 月 29 日 00:42

有热点数据了吧

awker · 2025 年10 月 29 日 00:42

配置缓存读写

awker · 2025 年10 月 29 日 00:42

增大内存，提高缓存

初识TiDB · 2025 年10 月 29 日 00:48

页失败，扩容内存

初识TiDB · 2025 年10 月 29 日 00:48

提高读命中率

北极星DB · 2025 年10 月 29 日 01:23

有些metric信息没有采到啊

北极星DB · 2025 年10 月 29 日 01:24

好家伙，nodeexporter没打开，cpu\mem漏了不少数据吧

三十柒号 · 2025 年10 月 29 日 02:29

已经把vmstat，numa的和buddyinfo都打开了，重启tikv后，问题没有再出现了，可能要等一段时间了

三十柒号 · 2025 年10 月 29 日 02:30

但现在内存才使用50%

三十柒号 · 2025 年10 月 29 日 02:31

大佬，每太明白，热点数据具体指什么，缓存读写是配置哪个

三十柒号 · 2025 年10 月 30 日 02:12

昨天又出现了，allocstall 和 compact stall 都是同步猛增：

allocstall

compact stall

mem major fault

系统盘根目录读流量