从一个运维人员的角度看微盟的这次删库跑路的节奏
这二天,微盟运维人员删库的事件刷屏了,造成的影响特别的大。

回顾整个事件,本人从15年的运维人员的角度来分析一下这个事件:
1、 为什么一个运维人员会有这么大破坏力,让整个公司业务都瘫痪了?
很多人都会说权限没控制好,不应该给单独一个人这么大的操作权限,同时一个人不应该有这么多业务和数据库的登陆和操作权限,没有操作分级和审核机制等等。
说实话,一般的公司,很难请几个不同角色的运维人员,财力与物力是不可能实现的(除了那几个大厂外),很多公司都是二三个运维人员,交叉管理不同业务授权,做不到职责明确分类。而且大部分职业上的习惯,会拥有最大的root权限(就算很多大互联网公司出来的运维也有这样的习惯)。
但是,绝大多数的中小型公司来说,是不会遇到本次这种极端状况的,真的遇到这样的事,真的是看命好不好,看运维人员的心情状态了,自求多福吧。
2、 为什么恢复时间会这么久,而且至今无法完全恢复?
极有可能是直接做了rm -rf或者fdisk这样的基本不可逆转文件删除操作,而且很可能是主备一起干掉了,同时可能平时没有做好备份机制,或者可能是把备份也一起删除了(很多公司备份基本上也是在运维人员手里的)。
3、那么,真的碰到这样的事了,有没有好的办法解决呢?
1)、使用云产品,而且要使用大厂的云产品,这里不是说你用云服务器就可以了,你需要用他们的云数据库产品,而且要买一系列的保护盾。
2)、权限控制,如果真的没法做到最小授权,建议上个主机安全管控软件,或者堡垒机,多次分层级的进行审核,角色分级操作,就是下级需要操作的时候,一定要通过主管领导的审核(特别是类似rm -rf 、fdisk、drop等等这样的高危命令的时候)。

本文从运维角度分析了微盟运维人员删库事件,讨论了权限控制、恢复困难的原因及应对策略。建议使用云产品、加强权限管控、建立备份机制,并强调企业文化与员工关怀在预防此类事件中的作用。
最低0.47元/天 解锁文章
1604

被折叠的 条评论
为什么被折叠?



