老房说数·第三期 ## 如何提高运维 TiDB 时的业务自解决能力,参与获得 “老房认证 DBA”徽章

大家好,周三的“老房说数”和大家准时相约。上周和大家聊了职业认证考试经历,发现很多有经验的数据库从业人员都考过 Oracle 的证书,努力好学是社区成员共同的特点:+1:上期话题获赞数最多的两位朋友是 @kissdb@qxhy123,恭喜两位获得 TiDB 定制超大鼠标垫~

双十一在即,很多团队的 DBA 小伙伴们也在准备打一场硬仗。对于 DBA 来讲,是否能快速定位、解决问题是核心技能之一,今天我们就聊聊,面对新数据库,我们是如何快速学习 trouble shooting 能力的。

先说说我的 TiDB 运维经历吧,PingCAP 这个公司对技术人员的实战经验还是很在乎的,虽然当时入职为“互联网架构师”,但公司要求很多职位都要先从一线 DBA 做起,这个要求对一个新人来说刚开始会很痛苦。面对一个新的数据库,线上有很多各种各样的问题扔给你,懵逼是必然的,我的应对简单来说就几招:

对问题进行分类,简单来说会分为原理性问题和操作性问题。对于原理性问题,就是看资料,当时官网的各种资料基本上全部看了一遍,有些经典文章,比如《说存储》建议反复阅读、理解。另外从知识消化的角度,看不如写、写不如讲,所以当时我边读现有文章,边尝试写一些东西。印象中写过比如《分库分表成本》、《Aurora 与 TiDB 架构对比》、《从业务副本维度看 HTAP 》等文章。在有一定理解后,开始尝试去讲一些东西,讲东西的时候建议不要只是照葫芦画瓢,要逐步加上自己的内容和理解。对于操作性问题,我觉得没啥好办法,找环境自己搭建吧,当时内部环境不够,老房我还在公有云环境上各种折腾。

后来在这个基础上,我们开始逐步完善一个内部 DBA 快速成长的 《军训计划》。四周时间,把最重要的学习内容进行抽象,然后由导师来进行每日指导(话说有兴趣的小伙伴可以来试一试)。再后来,我们在此基础上,结合开发同学的源码阅读系列,开始收敛成 PingCAP University 的 PTCP 52 个考试认证课程。

好了,不啰嗦了,大家在使用 TiDB 的过程中都是如何提高业务自解决能力的?PingCAP 官方和 TUG 提供了一些支持服务,但是运维 TiDB 的同学也需要能自己解决问题才有成就感,大家在这方面都有哪些经验,对 PingCAP 或 TUG 还有哪些需求?欢迎在这里告诉我你们的想法,参与本期话题的朋友们都将获得我精心设计的徽章一枚:sunglasses:,徽章是这样滴:

image

1赞

1、系统阅读官方文档 2、自己进行压测和破坏性测试,借助监控和文档甚至源码,尝试分析测试过程中出现的非预期现象,此过程的同时可以练习使用官方的运维工具 3、特定场景的提前演练 4、疑难杂症或紧急问题求助TUG社区或者直接请教PingCAP大神们 5、分享经验,帮助更多人

3赞

内部有工单系统,可以搜索常见报错及处理流程,这些资料我们接下来会进行整理,明年有计划集成到 asktug 里来。

1赞

推荐阅读:

  1. TiDB 经典三篇文章(《 三篇文章了解 TiDB 技术内幕 - 说存储说计算谈调度》)
  2. 其他各类别的技术文章非常多,按照自己的实际情况深度阅读就好了。

可以增加 Labs 测试运行集群环境。

优化: 官网博客中搜索切词不准确,比方说:搜索“申砾”,出来很多都是

建议: 官网博客可支持点击作者,罗列该作者的所有文章;

1赞

嗯,意见收到,不过第二点按照作者这个维度,估计还有一定的难度。

学习监控图关键指标可以帮助快速定位问题

房老师说的已经很好了,作为一个从Oracle、MySQL运维DBA逐步转向TiDB运维DBA和自动化开发的同学,我继续抛个砖:

1,反复阅读经典文章《说存储》《说计算》《谈调度》、以及经典的论文Raft、Percolator事务模型等等,夯实自己的理论基础。有余力的话,可以考虑多阅读一些分布式协议相关的东西,比如 raft协议的优化方面的文章,比如gossip协议的大致原理等等,同时记录下疑问有机会的时候找TiDB的官方同学请教 :smile:

2,从官方的运维文档出发,实际动手操作,记录自己对于操作的理解,形成的文档记忆会更深刻一些

3,不放过线上实际运维遇到的Case,结合自己的理解,慢慢深入剖析问题产生的原因和解决方案;

4,定期对于历史的Case进行复盘和总结,结合阅读TiDB的Release Note,看新版本是怎么解决之前的问题的。

5赞

经验丰富,学习了:+1:

1赞

潇姐果然经验丰富:+1:

嗯嗯,监控图关键指标这块如果同学有相关经验的话欢迎分享~

另外,给大家 share 一个好东西, TiDB performance map,建议大家反反复复的看一看。

tidb-map%20(1)

1赞

貌似不能全屏,如果下载不了的话,找我私要吧。

:+1::+1::+1: