tidb8版本安装的问题

【 TiDB 使用环境】生产环境
【 TiDB 版本】v8.1.1
【复现路径】
安装就会遇到
check的时候全部都是通过的,用的系统是华为云的arm架构,请问要怎么排查问题呢?目录权限,配置等都检查过了,会是我topology配置的问题吗?
这是我的配置

global:
  user: "tidb"
  ssh_port: 22
  deploy_dir: "/data/tidb-deploy"
  data_dir: "/data/tidb-data"

monitored:
  node_exporter_port: 9100
  blackbox_exporter_port: 9115
  deploy_dir: "/data/tidb-deploy/monitored-9100"
  data_dir: "/data/tidb-data/monitored-9100"
  log_dir: "/data/tidb-deploy/monitored-9100/log"

server_configs:
  tidb:
    log.level: info
    log.format: text
    log.enable-slow-log: true
    log.slow-query-file: tidb-slow.log
    log.slow-threshold: 3000
    log.file.max-size: 400
    log.file.max-days: 30
    log.filemax-backups: 100
    binlog.enable: false
    binlog.ignore-error: false
    split-table: true
    compatible-kill-query: true
    max-index-length: 3072*4
    enable-replica-selector-v2: true

  tikv:
    readpool.storage.use-unified-pool: false
    readpool.coprocessor.use-unified-pool: true
    slow-log-file: tikv-slow.log
    slow-log-threshold: 3s
    log.level: info
    log.format: text
    log.file.max-size: 400
    log.file.max-days: 30
    log.file.max-backups: 100
  tiflash:
    log.level: info
    log.format: text
    log.file.max-size: 400
    log.file.max-days: 30
    log.filemax-backups: 100
    profiles.default.max_memory_usage: 0
    profiles.default.max_memory_usage_for_all_queries: 0
  pd:
    schedule.leader-schedule-limit: 4
    schedule.region-schedule-limit: 2048
    schedule.replica-schedule-limit: 64
    schedule.low-space-ratio: 0.9
    server-memory-limit: 0.8
    log.level: "info"
    log.file.max-size: 200
    log.file.max-days: 15
    log.file.max-backups: 50

pd_servers:
  - host: 172.27.0.189
    deploy_dir: "/data/tidb-deploy/pd-2379"
    data_dir: "/data/tidb-data/pd-2379"
    log_dir: "/data/tidb-deploy/pd-2379/log"
    config:
      schedule.max-merge-region-size: 20
      schedule.max-merge-region-keys: 200000
  - host: 172.27.0.74
    deploy_dir: "/data/tidb-deploy/pd-2379"
    data_dir: "/data/tidb-data/pd-2379"
    log_dir: "/data/tidb-deploy/pd-2379/log"
    config:
      schedule.max-merge-region-size: 20
      schedule.max-merge-region-keys: 200000
  - host: 172.27.0.214
    deploy_dir: "/data/tidb-deploy/pd-2379"
    data_dir: "/data/tidb-data/pd-2379"
    log_dir: "/data/tidb-deploy/pd-2379/log"
    config:
      schedule.max-merge-region-size: 20
      schedule.max-merge-region-keys: 200000
tidb_servers:
  - host: 172.27.0.79
    deploy_dir: "/data/tidb-deploy/tidb-4000"
    log_dir: "/data/tidb-deploy/tidb-4000/log"
  - host: 172.27.0.143
    deploy_dir: "/data/tidb-deploy/tidb-4000"
    log_dir: "/data/tidb-deploy/tidb-4000/log"
  - host: 172.27.0.69
    deploy_dir: "/data/tidb-deploy/tidb-4000"
    log_dir: "/data/tidb-deploy/tidb-4000/log"

tikv_servers:
  - host: 172.27.0.157
    deploy_dir: "/data/tidb-deploy/tikv-20160"
    data_dir: "/data/tidb-data/tikv-20160"
    log_dir: "/data/tidb-deploy/tikv-20160/log"
  - host: 172.27.0.23
    deploy_dir: "/data/tidb-deploy/tikv-20160"
    data_dir: "/data/tidb-data/tikv-20160"
    log_dir: "/data/tidb-deploy/tikv-20160/log"
  - host: 172.27.0.185
    deploy_dir: "/data/tidb-deploy/tikv-20160"
    data_dir: "/data/tidb-data/tikv-20160"
    log_dir: "/data/tidb-deploy/tikv-20160/log"

tiflash_servers:
  - host: 172.27.0.210
    deploy_dir: "/data/tidb-deploy/tiflash-9000"
    data_dir: "/data/tidb-data/tiflash-9000"
    log_dir: "/data/tidb-deploy/tiflash-9000/log"
  - host: 172.27.0.86
    deploy_dir: "/data/tidb-deploy/tiflash-9000"
    data_dir: "/data/tidb-data/tiflash-9000"
    log_dir: "/data/tidb-deploy/tiflash-9000/log"

monitoring_servers:
  - host: 172.27.0.118
    deploy_dir: "/data/tidb-deploy/prometheus-8249"
    data_dir: "/data/tidb-data/prometheus-8249"
    log_dir: "/data/tidb-deploy/prometheus-8249/log"

grafana_servers:
  - host: 172.27.0.118
    deploy_dir: /data/tidb-deploy/grafana-3000

alertmanager_servers:
  - host: 172.27.0.118
    deploy_dir: "/data/tidb-deploy/alertmanager-9093"
    data_dir: "/data/tidb-data/alertmanager-9093"
    log_dir: "/data/tidb-deploy/alertmanager-9093/log"

【遇到的问题:问题现象及影响】
tidb server起不来

可以排除网络,目录权限问题,求大佬们指导下还有其他什么问题?
系统是鲲鹏的arm架构

tidb,tiup log 都提供下;另外可以去手动尝试 run下run_tidb.sh 看有没有什么发现。

另外端口问题也可以看看

tidb log 内容有啥

到143上看下tidb的日志,应该有具体的报错的


日志都是空的,没什么东西

日志是空的

这个脚本是在哪里的?
另外端口也是没被占用

那就去服务器上:
su - tidb
cd tidb-deploy 目录/scripts
手动执行下脚本:
./run_tidb.sh

或者看看系统日志,可能是 tidb 什么配置配置错了导致无法加载启动。

3 个赞

好的,发现问题了,确实是配置的问题,谢谢大佬🙏

1 个赞
  1. 查看日志文件
  • 检查TiDB server的日志文件,通常位于配置中指定的日志目录下(默认为/var/log/tidb或你指定的路径)。
  • 日志中可能包含错误信息或异常栈跟踪,这可以帮助你定位问题。
  1. 检查配置文件
  • 确认你的topology配置文件没有错误,尤其是TiDB server的相关配置。
  • 检查配置文件中的每个参数值,确保它们符合TiDB的要求。
  • 检查TiDB与PD、TiKV的连接配置是否正确,确保网络上没有问题。
  1. 验证权限
  • 确保TiDB进程的运行用户对数据目录和日志目录具有读写权限。
  • 使用命令确认权限:

bashCopy Code

ls -ld /path/to/tidb_data
ls -ld /path/to/tidb_logs
  1. 检查环境依赖
  • 确认系统是否安装了所有必需的依赖项,特别是在ARM架构上。TiDB可能需要特定版本的Go、glibc等库。
  1. 查看系统资源
  • 确保系统有足够的资源(CPU、内存、磁盘空间)来运行TiDB。
  • 使用命令检查资源使用情况:

bashCopy Code

top
df -h
free -m
  1. 检查防火墙设置
  • 确保防火墙没有阻止TiDB与PD和TiKV之间的通信。可以尝试临时禁用防火墙进行测试。
  1. 使用调试模式启动
  • 如果TiDB支持调试模式,可以尝试使用调试模式启动TiDB,获取更多的运行时信息。
1 个赞

猜测是哪个参数的下划线和中划线搞错了

是的 :joy:

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。