关于tidb在arm上部署

刚刚上面发的那是tidb的日志,

这是tikv的日志,查看日志好像是kv先挂的,但是不知道是什么原因

[2020/03/24 09:06:38.969 +08:00] [INFO] [signal_handler.rs:21] [“receive signal 1, stopping server…”]

[2020/03/24 09:06:38.969 +08:00] [INFO] [mod.rs:374] [“stoping worker”] [worker=snap-handler]

[2020/03/24 09:06:38.972 +08:00] [ERROR] [kv.rs:732] [“KvService::batch_raft send response fail”] [err=RemoteStopped]

  1. 看你提供的 TiKV 日志,是收到 tikv 是收到 signal 1 而退出的,请问是以服务启动的还是直接手工启动的?
  2. TiDB 的日志看起来是 gRPC 连接关掉了,确认下 TiDB 与 TiKV 之间的网络有问题,也有可能是 TiKV 挂掉了引起的。

您好,我们这边是手工启动的,没有使用ansible,

当我们查看状态的时候,不知道怎么tikv收到single就退出了,日志里也查不到原因

并且我们的tidb这时并未迁入数据,对于这个问题,我们十分困惑

请问下这边手工启动的方式是怎么操作的,麻烦详细描述一下。另外在 TiKV 收到 Signal 1 之前是做了什么操作,麻烦也详细描述一下。

手工启动的方式是按照X86脚本里的配置启动的,大致如下:

nohup ${G_TIDB_BINARY_DIR}/tikv-server --pd="${KV_PDS}" --addr="${TIDB_LOCALHOST}:${KV_PORT}" --data-dir=${G_TIDB_DATA_DIR}/${KV_NAME} --log-file=${G_TIDB_LOG_DIR}/tikv.log &

按照其中要求将集群加进去启动的各组件

TiKV 收到 Signal 1 之前一段时间内并未做什么操作,因为发现问题时这正处在早上九点刚上班的时候,当时是想进行数据迁移到tidb试试,失败时,才发现节点已挂断,前一天做的操作为:调试了监控grafana和prometheus。

建议可以按照 ansible 的逻辑来使用 systemd 来启动试一下。看下还会不会出现 Signal 1 的问题。

额,好的,我现在扩了节点之后暂时没有出现挂断的情况了,不过还是要谢谢你。我这边其实是想更多了解一下挂断的原因,什么情况会出现single1的错误,会不会内存不足或者其他什么原因?

建议您不是同一个问题,请新开帖子回答,不用在一个帖子里讨论多个问题,这个问题,再您的新帖子https://asktug.com/t/topic/33250 里讨论,多谢