节点buff/cache过高，求助大佬

TiDBer_lN8bLF2C · 2024 年9 月 19 日 13:41

四台32g服务器，混合部署两套tidb集群，配置中限制tikv节点内存使用，基本没效果。
之前对服务器A的一个tikv节点迁到服务器B上面，服务器A的buff/cache降到12g左右

应该怎么调整呢

小龙虾爱大龙虾 · 2024 年9 月 19 日 14:56

这又不影响啥， buff/cache 是可释放的吧，就是读写缓冲吧

TiDBer_lN8bLF2C · 2024 年9 月 19 日 15:03

极限情况时这样的，然后pd节点全部down掉了

小龙虾爱大龙虾 · 2024 年9 月 19 日 15:04

宕掉的日志呢？不是因为内存宕掉的吧

TiDBer_lN8bLF2C · 2024 年9 月 19 日 15:11

tikv里面就是各种超时，感觉就像服务没响应了

小龙虾爱大龙虾 · 2024 年9 月 19 日 15:20

其他节点呢，感觉这个节点是连不上远程节点了，看下 pd leader 日志呢

TiDBer_lN8bLF2C · 2024 年9 月 19 日 15:22

上面那个就是leader

YuchongXU · 2024 年9 月 20 日 00:12

内存有swap么

koby · 2024 年9 月 20 日 00:38

有没有防火墙这些

小龙虾爱大龙虾 · 2024 年9 月 20 日 01:56

PD 几个节点的进程都没有重启吗

templey · 2024 年9 月 20 日 02:07

pid为1360029跑的是什么

liuis · 2024 年9 月 20 日 02:43

内存该加还得加

cchouqiang · 2024 年9 月 20 日 04:13

感觉资源不够用

zhanggame1 · 2024 年9 月 20 日 06:19

内存就是太小了，tidb很吃内存，你不要在一个配置不高机器上混合部署这么多节点

residentevil · 2024 年9 月 21 日 05:03

先从/var/log/message里看下是否是因为内存oom导致的

有猫万事足 · 2024 年9 月 21 日 06:58

cpu和内存占用都很低，报错也集中在网络问题上，还是要从网络的方向查一查。

blog.csdn.net

Linux下的buff/cache_linux释放buff-CSDN博客

文章浏览阅读3.2k次。在Linux系统中，内存管理是一项极为重要的任务，内核通过分配页面来管理系统的内存。在保证内存有足够的空闲页可用的前提下，内核会尽量将页面分配给进程，以便进行内存管理。但是，当进程的内存需求超过了系统可用内存，内核就需要进行一些特殊的处理，通常是将部分进程的页置换到磁盘上的。则在内核获得了足够的可用空闲页面之后，利用这些页面创建缓存，并将被频繁读取的文件系统数据存储在缓存中。可以根据系统的实际情况进行调整，以提高系统的性能。默认值设置得很保守，可以根据系统的需求进行调整，...

buff/cache 的内存占比大概率不是问题所在，如果看不惯可以调整按照上面这个文档调整一下。再尝试一下。

koby · 2024 年9 月 21 日 09:42

看官方文档适当调整一下吧

tidb菜鸟一只 · 2024 年9 月 23 日 02:12

linux里面buff/cache里面占用的内存都是可以使用的内存，可以把他当成free就可以，就你现在的资源使用来看，内存肯定不是你这个机器的瓶颈。你的pd报错也是提示请求etcd失败，大概率是pd和tikv之间的网络有问题，往这个方向排查下吧。。。

kevinsna · 2024 年9 月 23 日 03:01

日志中显示 connection refused 错误，这通常意味着 PD 服务没有在预期的端口上监听，或者网络配置阻止了连接。检查 PD 服务是否在预期的 IP 地址和端口上运行，并且网络配置（如防火墙规则）允许从其他节点到 PD 的连接。

TiDBer_lN8bLF2C · 2024 年9 月 23 日 06:58

没有oom