TiFlash做tpcc时,CPU利用率低,5个OLAP并发就查询特别慢

【 TiDB 使用环境】POC
【 TiDB 版本】6.1.1
【遇到的问题】TiFlash做tpcc时,CPU利用率低,5个OLAP并发就查询特别慢
【做过的优化】
set @@tidb_distsql_scan_concurrency = 80;
set @@tidb_allow_batch_cop = 1;
set @@tidb_opt_agg_push_down = 1;
set @@tidb_opt_distinct_agg_push_down = 1;
SET GLOBAL tidb_max_tiflash_threads = 18;
set @@session.tidb_allow_mpp=1;
set @@session.tidb_enforce_mpp=1;
【问题现象及影响】
不做tpcc的时候,单独一个count很快,一旦做了tpcc就非常慢(tpcc测试也很慢,单独执行一个count也慢)。CPU毫无压力,内存,磁盘也都是利用率很低。我纯执行的OLAP,OLTP线程为0,所以不存在写入的干扰。总感觉是哪个线程数没有设置对,mpp打开也没有效果

【附件】 执行计划

【补充】
1、单独对一个千万级别的表做count操作100多ms(走tikv2秒,走tiflash100ms)
2、如果tpcc给5个OLAP线程,tpcc每个查询都得几十秒,上面所说的单独的count直接由100ms涨到了几十秒
停掉tpcc,在单独查询立马又到了100ms

可以尝试下,并发执行 count 的耗时
另外可以用这个 https://metricstool.pingcap.com/ 工具导出 tiflash-summary 监控,时间范围包括上面几个负载

可以在监控工具里面分析一下是否是磁盘或者系统负载过高

磁盘和系统负载特别低,毫无感觉

请参考上面的答复,导出下 tiflash-summary 监控,多谢。