请问一下如何才能保证生产的tidb稳定运行

本问题的核心是读写是无法随心扩展的

这就是写入放大问题呀,tidb还有一个更大的问题他的lsmtree是7层的,7层都写满的时候写入放大几百倍,会有毛刺这个官方7.0改了

“区分隔离AP和TP流量”是指使用不同的TiDB Server来承载TP和AP的请求吗?

是tp一个tidb
ap一个tidb 还是同一个集群

第四层已经250GB了,如果每层容量按10倍递增,到第七层达到250TB。没有生产环境堆到第七层吧,毕竟Region过多pd-worker 将成为瓶颈。

在同一个TiDB集群中,使用不同的Tidb Server来隔离AP和TP负载吗?

可以不同集群,使用ticdc部署主从集群,上游集群是 TP 集群,下游集群是 AP集群,好处是完全隔离互不影响,缺点是成本高。

此外,还可以在同一个集群实现HTAP:

存储层:tiflash可以承载比较大的数据分析需求,如果是基于部分行的轻量OLAP业务,也可以在tikv实现;总之,存储层可以通过tikv和tiflash搭配使用,隔离TP和AP压力。

SQL引擎层:tidb也可以做区分,可以只分配部分tidb-server 给AP用,它只访问tiflash;别的tidb-server 给 TP 流量用,专门负责处理线上 TP 业务

1 个赞

对,是这个思路,只要不是那种非常重度的超大数据分析,通过良好的设计,通常都可以在一个集群实现混合流量的处理,即 HTAP

如果能像ob那样租户资源隔离,HTAP的TP、AP隔离就简单了

这个得看资源管控能不能在7.0 GA了,期待

ob你生产使用过吗?效果如何?

听说已经有类似的功能了,在内部开发中,估计是半年后 GA

资源隔离可用了 在6.6

等4.1版本的话,不错

小故事是亮点,公司没有架构师编写规范的开发规约吗,像阿里那样的,最后只能是开发的锅dba去背。

说起容易做起难,不好把握。

规范这东西,开发有时候很反感,DBA不强势的话就很难推!