【TUG 话题探讨004】对 TiDB 的爱恨之情!

10 月 14 日晚上 8 点,第四期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“对 TiDB 的爱恨之情” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。

想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通

讨论节选

春雷(58同城):

  • 对 TiDB 最爱的是:官方服务完美;最恨的是手头有机器却不能快速解决性能问题

  • 对 TiDB 最爱的是:运维方便;最恨的是5.x版本稳定性不足,导致频繁踩坑

  • 对 TiDB 最爱的是:组件完善,接入数据比较方便;最恨的是对于机器资源要求比较高,导致运维成本有点高

  • 对 TiDB 最爱的是:官方活动频繁,社区活跃;最恨的是写文章奖励不高

  • 对 TiDB 最爱的是:能快速实现大规模运维;最恨的是TiFlash还是没达到需要的性能,被其他AP数据库抢了业务

  • 对 TiDB 最爱的是:能完美hold住HTAP;最恨的是:AP不独立,无法只用ap场景,导致写入慢

  • 对 TiDB 最爱的是:tiflash接入简单;最恨的是tiflash执行计划不准,导致不能走tiflash加速

  • 对 TiDB 最爱的是:监控图超全;最恨的是无法快速用起来各个图,快速定位问题受限

Dashboard & 问题排查

田朋(同程旅游):

这个 我同感 就不能搞个简单 好定位的 智能 巡检

陈臣(vivo):

+1,真是给得再多,不如懂我

何傲(神州数码):

+1,最爱的是:dashboard 解决了很多界面化需求;

最恨的是有些组件不好用,监控没有跟 tiup 打通

感觉Dashboard更新有点慢啊

张允禹(知乎):

dashboard 不知道 5.x 有没有按库分权限?

田朋(同程旅游):

只有root用户 你还分享链接给研发看?

最爱的是:版本迭代很快;

最恨的是:有时候好几个版本都有bug,一时不好定个稳定版本,导致线上频繁升级

田朋(同程旅游):

是的,业务不一定愿意陪你折腾

最爱的是:tidb就是为大数据量而生,可以方便扩容;最恨的是:超过一定规模,例如30T,写入就会有一定下降

最爱的是:支持大容量;最恨的是单集群多库,就会相互影响,就要拆分

最爱的是官方服务完美;最恨的是:排查问题要一堆材料,没有个统一的工具定位,导致排查问题有点低效

李欧(上海文广):

排查问题太简单dba就下岗了

陈臣(vivo):

很多深层次的问题要反馈给开发看,这点来说,DBA的成就感相对不高

李欧(上海文广):

问题越多说明系统越复杂,dba越值钱

张允禹(知乎):

分布式系统问题复杂度直接提升了一大块,出问题定位问题可能都需要小时计

陈臣(vivo):

大部分情况都不出问题,出了问题排查,定位,恢复时间有点长。

春雷(58同城):

这是分布式的痛点

何傲(神州数码):

我要吐槽一下有些报错提示,对研发友好,对运维不友好,看着报错信息不知道怎么办

何傲(神州数码):

有一些前台提示大量输出代码堆栈信息对运维来说没太多帮助

官方回应: TiDB 的产品目标之一是提高产品质量和可观测性。自 4.0 发布以来,TiDB 持续完善了性能诊断数据,例如新增了网络请求数、锁等待时间、未及时 GC 的数据量、磁盘 IO 数据量等。但这些仅是零碎的单点分析能力,还没有实现端到端发现问题、确定问题、解决问题。
TiDB 未来会持续改进、提升问题诊断效率,并针对运维所关心的 SQL 相关业务诊断和优化场景进行发力。

  1. 优化权限体系:5.3 起 TiDB Dashboard 将提供非 root 用户的登录方式,提高安全性。
  2. 提供场景化诊断手段:整合各类数据源(Grafana、各种不同维度的诊断数据等),建立对运维友好的 SQL 业务诊断和建议流程,让运维能够根据展示信息进行快速的问题判断和处理。
  3. 巡检工具:推出针对现有版本的巡检工具,将 PingCAP 多年的故障诊断逻辑作为规则,检查现有生产集群中有没有已知的潜在风险,并且将在未来持续更新巡检规则。
    TiDB 团队也希望能够和社区一起共建产品,期望大家多多提出自己在诊断方面的需求和建议,我们会快速迭代,让产品的问题诊断更加便利。

发版相关

田朋(同程旅游):

我感觉现在5.0的发版,不太好呢,是每个版本都有新功能了 5.2 5.3,但 5.0的小版本 bug修复的速度慢了啊

傅皓樑(恒生集团):

奖品怎么没有tidb服务免费一年,企业版免费用一年这种?

江坤(神州数码):

5.x不太稳,但是很多小功能都是5.x 才加进来

陈臣(vivo):

最爱的是免费,最恨的是版本更新太快

田朋(同程旅游):

新功能是挺快 但bug修复慢了

顾大伟(360):

最爱的是5.x新特性确实不错,遗憾的是确实反馈的bug问题回复慢

5.x稳定性确实不如以前

田朋(同程旅游):

不知道的人上来就5.2 就容易遇到坑,例如insert 写不如MySQL快

官方回应: 关于 TiDB 在 10 TB 和 100 TB 两个容量下的拓展能力,我们会在接下来半年重点看,Q3 会明确指标对 4.x 和 5.x 进行回溯,看是否有共性的改进点去重点投资源。另外对于版本发布的周期我们也希望倾听社区用户的建议,看看怎么能够更加符合用户的升级习惯。

TiFlash 相关

薛超(中移物联网):

tiflash 不好用啊

表妹:

tiflash 是因为文档不全的问题吗?

何傲(神州数码):

也有这个原因,官网文档很少才两三页吧

官方回应:
TiFlash 5.0 作为第一版 MPP 计算框架下的HTAP平台发布以来,半年来已经取得了长足进步。5.0 版本一开始的时候各种明显的 bug 还是较多,patch 打到 5.0.3 以后 bug 基本修复的差不多,但是遇到一些关键性的影响性能和稳定性瓶颈还存在,例如热点调度和垃圾回收等;升级到5.1以后在功能上有了进一步提高,然而还是暴露出一些读写压力较大条件下的稳定性问题。开发团队与 KA 客户一道,基于 5.1.1 版本进行了一系列的高压测试并修复暴露的 bug, 性能和稳定性显著提高。在某KA客户处(100节点以上的大集群)进行了较严苛的压力测试基本已经观察不到明显的bug(剩下的是更高层面的结构性/系统性的问题,比如重型查询的并发不能很高)。预计 TiFlash 5.1.3, 5.2.3, 5.3 会是相对质量较好的版本。近期我们也准备总结一个基于国内 KA 客户场景的产品发展历程。

生态周边

YY:

现在大家用tidb跟那些开源产品会放在一起用呀

李欧(上海文广):

redis\haproxy\ck和spark

陈臣(vivo):

其实没有很大的相关性啊,除了haproxy

社区分享

陈臣(vivo):

还有一个问题,有时候进行的分享还是偏运维性质,其实我们挺想听些原理性的东西。

田朋(同程旅游):

有,且很频繁

Meetup 预告 |TiDB Cloud 的云原生之路

HTAP 专场 | Meetup No.139 回顾

WinMagic : 使用窗口函数对关联子查询去关联化|DB Paper Reading 线上直播

社区周边

YY:

最后一个提问,大家还想要什么日常礼品吗~

陈臣(vivo):

书、PCTP考试券

何傲(神州数码):

双肩背包安排上

往期技术探讨回顾

话题征集,参与奖励 100 分,采纳奖励 300 分

加入 TUG

如果你也对数据库、大数据感兴趣,想与业界大咖们一起交流最前沿的数据库与大数据知识,欢迎加入 TUG,和 TUG 一起成长!

扫码报名或者点击链接跳转报名