使用docker启动pd出现cluster ID mismatch问题

启动pd的docker命令

出现的问题

正常机器日志

TiKV local id 和 PD 的 id 信息对不上。

  1. 排查是否有扩容 TiKV 目录没有清理,或者其他集群的的 TiKV 节点加入了集群
  2. PD 错误,非以前的 PD 集群。

谢谢,清除了目录成功启动了pd。但是在启动tikv时,出现了如下问题:

成功启动了一台TiKV

启动命令

您好,

建议将 pingcap/tikv:latest 变更为固定版本,明确 tikv 版本信息,避免一些不必要的错误:

已解决,谢谢

请问具体是怎么解决的?

就是我统一使用了4.0.0-beta.2 版本,启动就没有问题。

但是目前还有一些其他问题:

  1. 在用docker 启动时已经 用 -v /etc/localtime:/etc/localtime:ro 了,为什么docker里的时间还是比正常的晚8小时?
  2. pd一直在刷一个警告日志

还有能否提个小建议:感觉如果提问,我不太清楚什么时候有人给我回复了,有时候需要不定时的刷网页,有时就可能忘记了。是否可以在每个问题下加一个通知类似的,这个是否需要通知可以由用户选择。比较简单的方法是绑定微信。

  1. 日志时间在集群内部应该是统一的,使用的好像是UTC的时间,这个我们已经注意到了,已经反馈给研发同事.
  2. 你可以 使用curl获取这个信息,看是否成功。 另外,对于docker版本,仅限于测试功能,请不要使用在生成环境.
  3. 我们新回复之后,如果10分钟没有你的回复,会发送邮件

对于pd一直刷

[2020/04/05 04:33:41.369 +00:00] [WARN] [utils.go:35] ["request failed"] [url=http://0.0.0.0:10080/schema]

这个警告日志有点不明白,首先我用curl 也是拒绝连接。10080端口是tidb模块的docker里的端口,而且我在该节点上并没有启动tidb,为什么pd一直去请求这个??

  1. 首先这个日志是:Get schema Information about all db https://github.com/pingcap/tidb/blob/master/docs/tidb_http_api.md

  2. 检查下你的配置是否正确,是否有些使用的lastest,有些使用的beta2版本,或者有些ip地址配置的不对。 https://pingcap.com/docs-cn/v4.0/how-to/deploy/orchestrated/docker/

  3. 如果觉得没问题,首先集群重启一次,看下是否还存在问题。如果存在,请将配置文件上传,pd和tidb日志上传,多谢

TiDB集群启动.md (3.3 KB)

log.zip (91.0 KB)

我重新启动了,还是出现该条日志

您好: 看日志,都是关闭状态? 请确保启动每个进程,多谢

这个关闭状态没有关系吧!我只是copy日志时把集群关掉了而已,你可以在关掉日志之前能够看到一直刷那条警告日志的。你可以从启动状态看

好的,明白了,我找一下前面的日志,有结论会尽快答复,多谢

您好:

  1. 这个问题是dashboard 请求 tidb 报的错,需要使用比较新的 tidb docker compose https://github.com/pingcap/tidb-docker-compose/commit/04a59ae44d354d5a9d2060fb3ccea88d19b6d8fb
  2. 另外,请问,您是参考的哪个文档来安装的呢?是4.0的这个吗? https://pingcap.com/docs-cn/v4.0/how-to/get-started/deploy-tidb-from-docker-compose/

您好!

我是参考这个的 https://pingcap.com/docs-cn/v4.0/how-to/deploy/orchestrated/docker/

感谢,如果现在需要安装,请使用上面链接的docker compose。 对于文档,我们会尽快同步,多谢。

您好!

我现在是想在多台机器上启多个节点,但是在我认知中,docker compose 是用于一台机器上的。现在我就只能用docker swarm 或者 Kubernetes 吗(主要是这些还不太熟悉)

您好: 1. 之前的帖子,您是用docker按照单机文档,仅限于模拟功能测试安装的,(如果只是用于测试 TiDB 或体验 TiDB 的特性,建议使用 Docker Compose 在单机上快速部署 TiDB 集群。) 2. 如果要在多个服务器上安装,请参考ansible方式,按照正式环境安装。

您好!

我使用ansible 启动集群时,出现如下错误可能的原因是什么