初始化数据失败

我都是在一台机器上运行的 tidb-server pd tikv-server都是在一台机器上。 不可能出现网路问题 tidb的日志是7z的压缩格式


从tidb 日志看 pd 当时获取tso 也很慢,都秒级别了,到 凌晨4:21 no available connections ,大量类似警告,此时 tikv 应该已经panic 了,进程已经不存在了

看下服务器时间之类得,另外确认下当时机器得负载是咋样得? 看起来像是 pd 侧出现问题导致得,而且你是单机,任何一个组件出现问题都有问题

当时的情况是 cpu利用率不高 但是tikv占了很大几乎35G的内存

你其他正常得单机内存占用是多少呢? 从日志看也可能是内存耗尽导致服务器资源紧张(但是理论下内存耗尽,tikv oom 会自动拉起),PD 有问题,或者如果你有其他机器,可以尝试再扩两个pd 节点观察看下,把pd leader 放到其他机器看

“tikv oom 会自动拉起” 这里面的tikv oom发生的时候, 有在某个日志中显示出现oom之类的字样吗?我查看日志是没有看到有这样的字样。 “会自动拉起”指的是什么意思?

日志内没出现 oom 相关字样,只看见 panic,但是据你描述你单机机器 32G,你又说 tikv 占用35G,你可以查看下系统相关日志是否是内存溢出,自动拉起意思是正常oom理论会 tikv 进程会自动拉起,那个是猜测,没太多关系,panic 就不一定了

单机32G内存是以前的另外一台机器, 后来今天说的这个问题是在64G内存的机器上运行的。tikv崩溃后释放掉了35G内存,我有top收集的信息查到的。 tikv占用35G内存, 算正常吗?

tikv 异常进程退出当然会释放,你的问题不在于内存占用,tikv是存在 block cache,会占有内存,你可查看正常的集群对比下内存占用,你问题在于 TiKV 为啥异常 panic,从你描述应该机器内存没出现oom,应该内存还好,目前可以尝试检查下服务器时间是否有问题或者如果你有其他机器,可以尝试再扩两个pd 节点观察看下,把pd leader 放到其他机器看