启动集群tikv实例失败

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

【TiDB 版本】v4.0.6

【问题描述】新部署集群,其中tikv服务器上,每个服务器3个tikv实例,在集群初始化配置文件里面,numa_node分别写的是1,2,3。
这个是不是不能写3呢?我看启动tikv第三个实例的时候失败了,看实例日志报错:libnuma: warning:node argument 2 is out of range。

这个numa_node参数具体怎么配置呢?


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

这个是根据机器的 numa node 数量来决定

看到了,node就0和1,那如果一个服务器,三个tikv实例,那numa_node该怎么分配呢??
我的服务器48C,是不是要重新绑定一下,每个node分配16C

tikv 实例部署可以不绑核

你好,有3个疑问需要确定一下:
1、是不是tidb单机多实例场景下需要绑核?
2、如果我的tidb-server服务器上,一个服务器部署一个tidb server实例,那么numa_node设置为0就行吧?后面扩容的时候,我再继续使用别的node。

3、tikv实例部署的时候如果不绑核的话,是不是集群初始化参数文件中numa node参数去掉就可以了?
谢谢。

  1. 是的 ,tidb-server 建议绑核
  2. 是的,但是绑核了的话,只能使用到一半的资源
  3. 是的

1、那如果我初始化集群的时候,一个服务器就一个tidb server实例,TIDB也不绑核了,等以后扩容tidb-server的时候,我再重新绑核,也是可以的吧?

2、如果重新绑核以后,tidb整个集群需要重启吗?还是自动生效了就。

  1. 是的
  2. 重启对应进程就好