刚刚上面发的那是tidb的日志,
这是tikv的日志,查看日志好像是kv先挂的,但是不知道是什么原因
[2020/03/24 09:06:38.969 +08:00] [INFO] [signal_handler.rs:21] [“receive signal 1, stopping server…”]
[2020/03/24 09:06:38.969 +08:00] [INFO] [mod.rs:374] [“stoping worker”] [worker=snap-handler]
[2020/03/24 09:06:38.972 +08:00] [ERROR] [kv.rs:732] [“KvService::batch_raft send response fail”] [err=RemoteStopped]
您好,我们这边是手工启动的,没有使用ansible,
当我们查看状态的时候,不知道怎么tikv收到single就退出了,日志里也查不到原因
并且我们的tidb这时并未迁入数据,对于这个问题,我们十分困惑
QBin
(Bin)
25
请问下这边手工启动的方式是怎么操作的,麻烦详细描述一下。另外在 TiKV 收到 Signal 1 之前是做了什么操作,麻烦也详细描述一下。
手工启动的方式是按照X86脚本里的配置启动的,大致如下:
nohup ${G_TIDB_BINARY_DIR}/tikv-server --pd="${KV_PDS}" --addr="${TIDB_LOCALHOST}:${KV_PORT}" --data-dir=${G_TIDB_DATA_DIR}/${KV_NAME} --log-file=${G_TIDB_LOG_DIR}/tikv.log &
按照其中要求将集群加进去启动的各组件
TiKV 收到 Signal 1 之前一段时间内并未做什么操作,因为发现问题时这正处在早上九点刚上班的时候,当时是想进行数据迁移到tidb试试,失败时,才发现节点已挂断,前一天做的操作为:调试了监控grafana和prometheus。
QBin
(Bin)
27
建议可以按照 ansible 的逻辑来使用 systemd 来启动试一下。看下还会不会出现 Signal 1 的问题。
额,好的,我现在扩了节点之后暂时没有出现挂断的情况了,不过还是要谢谢你。我这边其实是想更多了解一下挂断的原因,什么情况会出现single1的错误,会不会内存不足或者其他什么原因?
yilong
(yi888long)
29
建议您不是同一个问题,请新开帖子回答,不用在一个帖子里讨论多个问题,这个问题,再您的新帖子https://asktug.com/t/topic/33250 里讨论,多谢
来了老弟
31
system
(system)
关闭
34
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。