为什么要做主备机房

最新推荐文章于 2025-02-21 20:18:52 发布

原创最新推荐文章于 2025-02-21 20:18:52 发布 · 688 阅读

CC 4.0 BY-SA版权

简单来说，主备机房切换只是我们 “上云五步骤” 中的初始化环节，最终实现将我们的应用逐步逐步的搬上云：
看到这样的步骤，许多老师会萌生吐槽的极大冲动，您先别急，容我来对 “上云五步骤” 做些解释：
1、出于成本的考虑，除ucache之外（包括阿里与腾讯），没有一家供应商允许将 ‘IOE’ 搬入他们的机房，所以最终选择在 ‘ucache’ 内搭建我们的新机房，然后通过内网与ucache进行互联。
2、出于成本的考虑，专线扩容的申请被CEO驳回，最终无法实现伪双活的方案（要求拿出应用视角的流量数据提供参考，由于缺乏完美的监控体系，无法做到）。
3、出于成本的考虑，也同时考虑到将来迁移至云机房后的折旧因素，新机房的硬件投入只有老机房的50%。
除了以上三点之外，还有一些细节，因为不是重点就不一一举例了，说多了都是泪。

那些客观条件下的迁移方案 -
方案一：整体冷切
策略：利用周末交易停止，访问量下降的环境优势，进行整体环境切换。
方式：核心业务数据库1：0.5建立环境，核心业务应用1：0.3建立环境、非核心业务数据库直接搬迁，非核心业务应用直接搬迁
优势：
只须考虑搬迁设备的安全及留足设备上下架时间
只须考虑域名及CDN切换时间
缺点：
整机搬迁存在设备搬迁后故障，无法启动的问题，设备搬迁的数量较多，此情况易出现，搬迁前须做好数据库导出独立存储的准备；
设备一次性迁移数量较多，搬迁过程中上下架时间较长，加上外高桥机房对设备有严格的出入管理，报关、检查时间较长；
当发现备节点无法承接业务时，回退时间较长；
停机时间较长；
方案二：降级冷切
策略：利用周末交易停止，访问量下降的环境优势，进行主机房降级，备机房升级的切换。
方式：将主节点所有业务应用+数据库数量由1：0.5，将下架设备集中运往备份节点，进行环境调试，完成备份机房由0.5升级为1的过程。
优势：
停机时间短，预计总停机时间在数小时内（第二次切换须进行大面积程序验证，预计耗时N小时以上）
数据风险较小，核心及非核心业务数据部分在切换前都采用热备方式进行双向同步
提供回退保障，在备份节点业务出现无法启动情况下，可以快速将服务切换回原主节点
在切换前可以通过提前验证的方式提高切换质量
部分关键设备（如数据库），由单机转换成大容量虚拟机，可有效保障切换顺利
切换时间可控性强，包括联合测试、运营进行线上检测也可灵活安排
缺点：
整须提前搭建环境，须前期占用一部分人力资源搭建第二套全环境
方案三：伪双活逐步切换
策略：两端通过负载均衡设备进行访问均衡，逐步将业务从主节点切换至备份节点。
方式：利用机房内负载均衡设备将部分主机房流量引入备份机房，然后备份机房配置数据库实现写回源、读本地，逐步将访问全部切换至备份机房，然后直接将访问切换至备份机房。
优势：
访问停机少，前期分流存在多次闪断，后期有一次N分钟的DNS切换
缺点：
业务访问环境构建复杂，除两节点搭建前端应用外，还须快速配置后端访问节点，易出现人为操作故障（在数据库配置错误的情况下也易出现脏数据，届时对清算、交易可能产生较大的数据恢复难度）
前端应用在未实现统一配置管理的情况下，靠人工配置危险系数极高
双向伪双活对主备间带宽要求较高，目前X兆带宽只能保证业务数据库的同步
产生的成本最高，线路费用、人工费用、多次搬迁存在的风险

其实，最终我们执行的是方案一和方案二的结合：
切换当天：整体冷切，将老机房的所有硬件数量由1容量，迁移至新机房的0.5容量，并通过降级、限流等手段，顺利的挺过了首个交易日。
切换后的三天内：将老机房的硬件逐步下架运往新机房，并完成备份机房由0.5升级为1的过程。

最后说两句 -

Ucache灾备云企业数据备份软件提供了多种备份模式，在新建任务时，用户可自由设置各种备份模式，如单双向同步、镜像同步、移动同步等，还可以根据文件名或者目录名来选择性的备份，在设置时，选择“文件过滤”。
再比如，Ucache灾备云企业数据备份软件还具有另一个人性化的功能—定时备份，它提供了每月、每周、每日、间隔和实时多种定时方式，根据需要设置固定时间来进行数据备份。

Ucache灾备云电脑备份不仅高效稳定，而且占用的资源很少，在备份文件时也异常迅速，完全不会影响电脑速度，可以说它是国内最好的电脑备份软件，使用它为企业建立一个完善的备份与恢复的灾备体系，实现数据自动化备份容灾管理，时刻保护企业数据安全。