流水记录表,用tidb是做物理分表还是底层分区好

流水记录表,用tidb是做物理分表还是底层分区好

多少数据量?从原理上来说,tidb每个表对应到tikv上都是分成了好几个region的。
所物理分表根本无用,你分了表也是分成region存。完全有可能你分了几个表,其实存在一个region里。
分区完全是为了删除数据/根据placement rules配置冷热数据分离。完全是管理向的,对并发写入/读取没什么提升。

你需要提升并发能做的就是减少读写热点,增加硬件,水平扩展读写能力。

分表 还是分区取决于你的数据体量以及查询业务场景。如果是在线数据与历史数据分开,还是分表的好。比如在线数据保存最近3个月以供AD hock这种点查,3个月前的称历史数据,用于异步的批量查询等场景。也如楼上所说,Tidb采用列簇以及region在物理存储数据,会自动管理分裂及合并,理论上是在存储性能足够情况下,对PB级别以下数据体量不敏感。

我们把时序报文数据存到时序数据库去了 tidb存这些数据成本太高

1 个赞

tidb设计出来就是解决mysql物理分表的问题,所以你可以选择分区。
历史数据的分区定期删除就行

现在底层3个kv节点,32cpu,64内存的

配置不低,分区表就行

这个配置挺好的。

分区表…