【TiDBer 唠嗑茶话会 60 】研发写了个 SQL 查询 OLAP 库,放到首页上了,因为早高峰登录的并发把 OLAP 库压死了,怎么措辞给领导汇报这件事?

事故影响:早高峰期间数据库不能服务xx分钟,影响xx业务。
事故原因:研发未经充分压测上线sql查询语句。
事故处理:紧急优化sql。
后续处理:所有上线sql,都需经过充分测试,审核。

1 个赞

先和领导说此次时间段影响,然后阐述原因,提出解决方案

找到问题语句,快速恢复业务

提前预案,跟领导说明原因,先把问题解决了

实事求是说明情况

定位SQL,突出olao对并不适合,首页应该提供缓存更合适

实事求是描述问题及处理过程,并给出规避方案。

实事求是描述问题及处理过程,并给出规避方案。
1.首先排查问题,提出解决方案
2.坦诚对待承担责任
3.事后复盘

事故现象:早高峰期间首页卡住,不能登录。
事故原因:表面原因,OLAP库被压死
根本原因:研发未经充分压测,在首页上线了OLAP业务类sql并放到了首页。
事故处理:紧急优化sql。
后续处理:所有上线sql,都需经过充分测试,审核。

先找到问题根因,良好的认错态度和解决问题的方案应该可以获得领导的认可 :rofl:

拉上研发进行甩锅 :rofl:,白嫖奶茶

1.binding个sql临时解决,开发赶紧下线这个
2.报告给领导影响时间段和产生问题的原因
3.提出解决方案,管控新功能新sql的流程
4.拿n+1走人

别慌,让子弹飞一会。好好想想发生了啥,是流程问题,还是 技术问题,哪里才是根本点。从小问题,看大问题,才是能力的体现。

你这软广打的我措手不及

1 个赞

尊敬的领导:
我们近期在首页上放入了一个 SQL 查询 OLAP 库,用以提供更多的用户体验,但是因为早高峰登录造成的并发访问量比常规访问量大得多,所以已经造成 OLAP 库被压力过大而出现故障。我们正努力排查原因,制定解决方案,以保证 OLAP 库的稳定运行。

1 个赞

实话实说罢了,我司现在使用TiDB的产品组已经由一个变成了两个,逐渐成燎原之势~

排查原因、扒日志、实事求是说明情况,后续架构升级还得看领导、

还是要先解决排查问题

找到问题语句,分析问题原因,快速恢复业务;
提出问题的解决方案及资源需求请领导审批。

领导,我错了