记公司ERP服务器硬件扩容项目
一、未雨绸缪
2013年从我们发动机公司ERP系统上线以来,不断承载了新加入的业务系统:淮海动力、变速器、容大、进出口、配件、印尼。而服务器的硬件配置运行5年,因为新业务系统的加入,在月结的那几天,我们的服务器负载很大,有用户抱怨服务器慢了。作为ERP系统基础模块的管理员,我无时不刻的关注作这个问题。2019年初,我得到一个好消息,我们还有一些内存和CPU硬件资源可以给服务器扩容。我开始准备ERP服务器硬件的扩容。
二、详细的调研
我找到我们维保单位的赵工,和他一起梳理服务器的硬件情况,春节的节前节后,他从成都赶到我们机房实地调研好几次,然后回去远程查技术资料,最后他确认,我们有硬件资源可以升级。我非常高兴,找到ERP项目经理张宾,告诉他我们可以给服务器作硬件扩容,请他安排服务器停机时间。但是ERP系统承载的业务复杂,工作时间跨度很长,过了几天,我得到反馈,服务器很难找到停机时间,我感觉我遇到了一个棘手的问题。
我开始和赵工讨论这个问题,他第一次告诉我,我们的服务器硬件支持在线扩容,但他也拿不准,几天后,他确认服务器有在线硬件扩容的功能。接下来我想到在线硬件扩容肯定会在开发环境展开,我担心在线扩容功能会破坏我们的开发环境,我再去求证了其它的IBM工程师,但因为这个功能,真正使用过的不多,都没有回复。某天,我同刘楠浩谈到这个功能时,他也告诉我,我们的服务器有这个高级功能,而且他作过。
三、详细的计划与方案
基于目前的成熟条件,我们已经可以开始对ERP系统作硬件扩容升级工作。我制定了详细的计划和具体的执行方案:
计划先对开发服务器在线不停机升级物理内存和CPU,再对测试服务器在线不停机升级物理内存和CPU,最后再对正式环境服务器在线不停机升级物理内存和CPU。我把计划和具体的执行方案邮件发给同ERP相关的所有人员和领导(包括部长),在ERP群中同大家讨论升级的事情。
四、没有中断业务的升级
2019年3月,按计划我们完成了开发环境和测试环境的升级后,我们等待开发环境和测试环境运行了整整一个月。没有一点问题。2019年4月,我们还是找了一个业务空闲的周六(避免在升级异常后影响业务),只用了10分钟,我和刘楠浩成功完成了ERP系统的在线不停机硬件升级。ERP服务器从16CPU、32GB内存升级为32CPU、64GB内存,硬件处理能力提升了一倍。
五、充分的准备是成功的关键
为了真正升级的10分钟,我们从年初听到消息到最后完成,历经整整3个月的时间;从带来好消息的一个人,到整个升级过程都被ERP团队所关注。 我想这些准备都是值得的,它是我们最后成功的保证。
本文记录公司ERP服务器硬件扩容项目。因新业务加入,服务器负载增大。作者先确认有硬件资源可扩容,后经调研发现服务器支持在线扩容。制定详细计划,先对开发、测试服务器升级,运行一个月无问题后,于业务空闲时对正式环境升级,硬件处理能力提升一倍。
1026

被折叠的 条评论
为什么被折叠?



