使用tidb和tispark对1亿大表查询出现超时报错

这里超时应该是因为 TiKV 压力较大导致 request 进入排队时间太久,可能的原因是 Region 太大或者 TiKV 集群压力太大。可以从这两个角度查看监控确认一下。

能否提供一下集群的拓扑信息和环境配置,方便计算?

会的。

最后请问一下数据导入是通过 lightning 吗?可以看看这个回答是否有帮助:lightning 导入大表,select count(*) 报错:Execution terminated due to exceeding the deadline - #6,来自 小王同学