执行tiup命令,延迟8s退出

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
v5.0.3

【概述】场景+问题概述

执行tiup命令,延迟8s~9s后退出,例如执行命令tiup cluster list,动图如下:
tidb

补充说明:执行其他的tiup命令也会存在这个问题

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

1 个赞

上个错误日志

命令是可以执行的,只不过是输出结果后,退出命令行有延迟,没有错误日志记录的

可以考虑排查一下机器的性能问题。看看 top 命令机器资源有没有被打满。
如果可以的话,中控机重启一下

中控机的负载非常低,应该不是机器资源导致的,重启中控机好像不管用

卡的时候 tiup 在做什么呢
你可以用 strace 看看
strace -t -o strace.out tiup cluster list
然后分析一下 strace.out 内容

下面是strace日志,协助帮忙看看是哪里的问题


14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = -1 EAGAIN (Resource temporarily unavailable)
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:26 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = ? ERESTARTSYS (To be restarted if SA_RESTART is set)
14:50:31 — SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=50664, si_uid=1001, si_status=0, si_utime=2, si_stime=2} —
14:50:31 rt_sigreturn({mask=[]}) = 202
14:50:31 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = -1 EAGAIN (Resource temporarily unavailable)
14:50:31 futex(0xc00005e950, FUTEX_WAKE_PRIVATE, 1) = 1
14:50:31 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:31 epoll_pwait(3, [{EPOLLOUT, {u32=1963443736, u64=140112386573848}}], 128, 1999, NULL, 7) = 1
14:50:31 epoll_pwait(3, [{EPOLLOUT, {u32=1963443736, u64=140112386573848}}], 128, 1999, NULL, 7) = 1
14:50:31 epoll_pwait(3, [], 128, 0, NULL, 10801006) = 0
14:50:31 epoll_pwait(3, [{EPOLLOUT, {u32=1963443504, u64=140112386573616}}], 128, 1999, NULL, 7) = 1
14:50:31 epoll_pwait(3, [], 128, 0, NULL, 10801006) = 0
14:50:31 epoll_pwait(3, [{EPOLLOUT, {u32=1963443504, u64=140112386573616}}], 128, 1999, NULL, 7) = 1
14:50:31 epoll_pwait(3, [], 128, 0, NULL, 10801006) = 0
14:50:31 epoll_pwait(3, [{EPOLLIN|EPOLLOUT, {u32=1963443504, u64=140112386573616}}], 128, 1999, NULL, 7) = 1
14:50:31 futex(0x5600b1cd59d8, FUTEX_WAKE_PRIVATE, 1) = 1
14:50:31 read(9, “\376\214\201\200\0\1\0\1\0\0\0\0\ttelemetry\7pingcap\3c”…, 512) = 55
14:50:31 epoll_ctl(3, EPOLL_CTL_DEL, 9, 0xc0001e8874) = 0
14:50:31 close(9) = 0
14:50:31 futex(0xc00005e950, FUTEX_WAKE_PRIVATE, 1) = 1
14:50:31 epoll_pwait(3, [], 128, 0, NULL, 824634470784) = 0
14:50:31 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:31 epoll_pwait(3, [], 128, 0, NULL, 2) = 0
14:50:31 epoll_pwait(3, [], 128, 1983, NULL, 7) = 0
14:50:33 futex(0xc00005e550, FUTEX_WAKE_PRIVATE, 1) = 1
14:50:33 epoll_pwait(3, [], 128, 0, NULL, 10801008) = 0
14:50:33 futex(0x5600b1cd60b0, FUTEX_WAIT_PRIVATE, 0, NULL) = 0
14:50:36 epoll_pwait(3, <unfinished …>) = ?
14:50:36 +++ exited with 0 +++

你是在线安装的tiup component吗?我之前在线安装也是很慢,后来卸载使用离线包安装使用就很快了。

不是,我是从官网下载的离线包安装的,公司内网访问不了公网

楼主自己分析分析先。我的直觉这不是 tiup 的问题,而是你这个本地环境的问题(除了这个命令,碰到过其他不正常的现象吗,多试试其他操作,涉及到磁盘和网络的,试试看),你也可以把 tiup 迁移到别的机器,排除一下。

我不是 tiup 的开发,不知道这些系统调用为啥不正常,比如你给的结果里有一个返回ERESTARTSYS 的调用,那里耗了5秒

1、其他的命令都可以正常执行,主机层也没发现有啥问题
2.我把tiup的集群配置迁移到其他集群上,也是一样的问题

试试这个

非常感谢,确实是这个遥测数据上传问题导致的,关闭之后具没有问题了

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。