生产环境操作注意事项

因为我们采用的是底薪加绩效的模式,A绩效占底薪百分之五十,B绩效是百分之二十,C绩效只能拿底薪,生产事故占绩效评比很大一部分,如果当月有生产事故,那肯定与A绩效无缘,如果生产事故特别大,B绩效也没有,想请问大佬们生产环境上线变更注意事项,以防万一。

做操作之前,准备好几个脚本,并提前在测试环境做好充分验证测试:

  1. 备份脚本
  2. 执行脚本
  3. 验证脚本
  4. 回滚脚本

如果不能都做到脚本化,起码思路上要做好兜底策略

1 个赞

操作时,双人复核,避免个人操作失误疏忽,降低风险。

测试验证,备份

少做变更 :joy:

系统做好checklit检查,高可用验证、性能压测验证、备份恢复验证。配置合理的监控告警策略。
生产环境尽量少动,不清楚的操作不要执行,大变更前做好测试。
遇到事故第一时间先解决问题在分析原因。

少做变更,在生产坏境先测试完好。

我个人觉得任何验证机制,其实也挺难解决操作错误的问题的。
但是脚本化/自动化,是确实可以减少故障时间的。要尽可能的做好。

另外就是重点考虑boss是不是既要你压成本又要你没有生产事故。
这两个是比较难兼得的。
起码假如他的要求是这个,应该尝试为自己争取一些额外的绩效加成。
不然就感觉。。。难绷

1、做好监控;
2、数据变更前,做好备份或者准备好回滚脚本;
3、出了问题第一时间报告,准备证据找人背锅;
4、找不到人背锅就只有自己背。