【 TiDB 使用环境】
【概述】场景+问题概述
生产环境,两台主机组成的集群,一台机部分数据丢失
要怎么做才能最大程度的恢复数据?
【背景】做过哪些操作
tidb服务无法启动,pd可以启动,tikv一台能启动一台不能启动
【现象】业务和数据库现象
【业务影响】
【TiDB 版本】
V4.0.11
【附件】
- 相关日志 和 监控
-
TiUP Cluster Display 信息
[tidb@crm-dc-13 ~]$ tiup cluster display test-cluster
Found cluster newer version:The latest version: v1.5.6
Local installed version: v1.4.1
Update current component: tiup update cluster
Update all components: tiup update --all
Starting component cluster
: /home/tidb/.tiup/components/cluster/v1.4.1/tiup-cluster display test-cluster
Cluster type: tidb
Cluster name: test-cluster
Cluster version: v4.0.11
SSH type: builtin
ID Role Host Ports OS/Arch Status Data Dir Deploy Dir
200.100.1.13:9093 alertmanager 200.100.1.13 9093/9094 linux/x86_64 inactive /tidbdata/deploy/data.alertmanager /tidbdata/deploy
200.100.1.13:3000 grafana 200.100.1.13 3000 linux/x86_64 inactive - /tidbdata/deploy
200.100.1.13:2379 pd 200.100.1.13 2379/2380 linux/x86_64 Down /tidbdata/deploy/data.pd /tidbdata/deploy
200.100.1.17:2379 pd 200.100.1.17 2379/2380 linux/x86_64 Down /tidbdata/deploy/pd-2379/data /tidbdata/deploy/pd-2379
200.100.1.13:9090 prometheus 200.100.1.13 9090 linux/x86_64 inactive /tidbdata/deploy/prometheus2.0.0.data.metrics /tidbdata/deploy
200.100.1.17:9090 prometheus 200.100.1.17 9090 linux/x86_64 inactive /tidbdata/deploy/prometheus-9090/data /tidbdata/deploy/prometheus-9090
200.100.1.13:4000 tidb 200.100.1.13 4000/10080 linux/x86_64 Down - /tidbdata/deploy
200.100.1.17:4000 tidb 200.100.1.17 4000/10080 linux/x86_64 Down - /tidbdata/deploy/tidb-4000
200.100.1.17:9000 tiflash 200.100.1.17 9000/8123/3930/20170/20292/8234 linux/x86_64 N/A /tidbdata/deploy/tiflash-9000/data /tidbdata/deploy/tiflash-9000
200.100.1.13:20160 tikv 200.100.1.13 20160/20180 linux/x86_64 N/A /tidbdata/deploy/data /tidbdata/deploy
200.100.1.17:20160 tikv 200.100.1.17 20160/20180 linux/x86_64 N/A /tidbdata/deploy/tikv-20160/data /tidbdata/deploy/tikv-20160
Total nodes: 11
-
TiUP Cluster Edit Config 信息
-
TiDB- Overview 监控
- 对应模块日志(包含问题前后1小时日志)