事故影响:早高峰期间数据库不能服务xx分钟,影响xx业务。
事故原因:研发未经充分压测上线sql查询语句。
事故处理:紧急优化sql。
后续处理:所有上线sql,都需经过充分测试,审核。
1 个赞
先和领导说此次时间段影响,然后阐述原因,提出解决方案
找到问题语句,快速恢复业务
提前预案,跟领导说明原因,先把问题解决了
实事求是说明情况
定位SQL,突出olao对并不适合,首页应该提供缓存更合适
实事求是描述问题及处理过程,并给出规避方案。
实事求是描述问题及处理过程,并给出规避方案。
1.首先排查问题,提出解决方案
2.坦诚对待承担责任
3.事后复盘
事故现象:早高峰期间首页卡住,不能登录。
事故原因:表面原因,OLAP库被压死
根本原因:研发未经充分压测,在首页上线了OLAP业务类sql并放到了首页。
事故处理:紧急优化sql。
后续处理:所有上线sql,都需经过充分测试,审核。
先找到问题根因,良好的认错态度和解决问题的方案应该可以获得领导的认可
拉上研发进行甩锅 ,白嫖奶茶
1.binding个sql临时解决,开发赶紧下线这个
2.报告给领导影响时间段和产生问题的原因
3.提出解决方案,管控新功能新sql的流程
4.拿n+1走人
别慌,让子弹飞一会。好好想想发生了啥,是流程问题,还是 技术问题,哪里才是根本点。从小问题,看大问题,才是能力的体现。
你这软广打的我措手不及
1 个赞
尊敬的领导:
我们近期在首页上放入了一个 SQL 查询 OLAP 库,用以提供更多的用户体验,但是因为早高峰登录造成的并发访问量比常规访问量大得多,所以已经造成 OLAP 库被压力过大而出现故障。我们正努力排查原因,制定解决方案,以保证 OLAP 库的稳定运行。
1 个赞
实话实说罢了,我司现在使用TiDB的产品组已经由一个变成了两个,逐渐成燎原之势~
排查原因、扒日志、实事求是说明情况,后续架构升级还得看领导、
还是要先解决排查问题
找到问题语句,分析问题原因,快速恢复业务;
提出问题的解决方案及资源需求请领导审批。
领导,我错了