tidb6.1单机部署性能问题

【 TiDB 使用环境】Poc
【 TiDB 版本】6.1
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
现在我们有套测试环境,因为资源问题只能通过单机部署TIDB。虽然是测试环境,但是上面一直跑的是生产数据,而且有用户一直在使用,之前用了一段时间都没什么问题。前几天突然出现卡顿情况,平时不到一秒执行完的sql都需要二三十秒。然后当时尝试重启没有什么作用,就尝试着把TIKV扩成了三副本,但是还是在同一台机器的同一个磁盘里。现在数据库恢复正常了,但是不清楚是扩容的原因还是之前的阻塞随时间解决了。现在观察服务器CPU还好,主要是内存和IO会到顶。短时间内我们还不具备切换环境的条件,所以想咨询一下各位,现在我这边还有什么能优化的空间。
【资源配置】


【附件:截图/日志/监控】


环境中所有组件用一块盘,IO高也是正常。 看是不是能通过集群config 层面限制下内存使用了

先把内存升上去,先把好解决的瓶颈搞定

单机部署就1个pd一个tikv 一个tidb就行,tiflash很吃资源最好不用

去掉会影响查询速度吗

看下先贼最占内存是的tidb-server还是tikv,对应的内存控制阈值改低一点,你这内存快100%了,tiflash直接干掉吧,tiflash只能单独找机器部署,占资源太多,容易把其他服务搞挂

资源到瓶颈了

扩容硬盘内存了考虑

内存不足

干掉tiflash这个吧

典型tikv遇到无法访问原因:
1,IO能力不足,写崩了;看IO的情况,临时解决方案是平均IO。
2,内存不足,OOM;查看dmesg -T;如果确有其事,
在耗内存的地方,session设置变量—把水流开关拧小;减小chunksize tidb_max_chunk_size;减少executor_concurr和dist_sql_concur的并发;tidb_index_lookup_size减小索引读;慢慢,稳稳。
3,上述确认是问题:简单粗暴的办法是加内存,换nvme。

目前看服务器的资源有限,去掉应该更好