最近在考虑公司云平台的切换,期间接触了很多云厂商,同时为了接入云平台,在内部增加了技术运维的编制,面试了很多技术人员,了解了很多中小型企业在使用云的过程中碰到的问题,整体进行一些思考与大家分享。
一、该不该上云
该不该上云取决于几个点:
1、建设及运维成本
我们对自有机房的建设成本和使用云服务的建设成本进行比较,以50㎡机房,200台云主机、云数据库和中间件为例:
成本分类 | 成本项 | 自建机房+运维 | 公有云服务 | ||
具体配置 | 费用 | 具体配置 | 费用 | ||
机房建设 | 机房建设 | 机房装修+UPS+机柜+空调 | 60W | - | - |
硬件采购 | 服务器 | 20台超融合服务器 | 120W | 200台云主机、云数据库和中间件 | 150W |
操作系统 | linux系统 | linux系统 | - | ||
虚拟机系统 | VM | 10W | - | ||
存储设备 | 30T | 50W | 30T云存储 | - | |
安全设备 | 防病毒+WAF防火墙+DDOS攻击防护等 | 25W | 云主机安全服务+云防火墙+DDOS攻击防护等 | 25W | |
网络设备 | 交换机+路由器 | 15W | 虚拟化交换机和路由器(无需购买) | - | |
使用成本 | 网络 | 互联网线路100M+ | 3W/年 | 互联网线路100M+ | 7W |
电费 | 电费 | 5W/年 | 不需要 | - | |
维护成本 | 硬件维护成本 | 每年取设备运维成本5% | 不需要 | - | |
运维成本 | 3人年*40万/人年 | 120W/年 | 2人年*40万/人年 | 80W/年 | |
总计 | 首年成本/5年总成本 | 408W/920W | 首年成本/5年总成本 | 262W/1310W |
备注:自建机房需要安全+服务器+网络+数据库3人,公有云服务,安全+数据库2人
自建机房短期成本高,但如果按照5年的使用周期,自建机房5年总成本比使用云服务的成本低约40%。但中小型公司尤其是初创公司,前期规模较小,对成本的控制比较严格且人员多为“一人多岗”,可以根据实际情况考虑是否自建数据中心。
2、可扩展性
1、抛开业务爆发性发展的可能性,公有云服务和自建机房的可扩展性差别不大,可以基于对业务的预测进行硬件资源的采购以保证硬件资源满足业务发展;
2、当今的VUCA时代,各种环境的不确定性因素带来了业务发展及规模的不确定性,从这个角度看,云平台的租赁更有优势,可以随着业务的调整对租赁规模进行调整,以应对不确定性,控制采购成本。
3、管理能力
从近期面试的情况看,完全使用云平台与不用云平台,对技术人员的能力要求差异是非常大的。
公有云主要提供IAAS、PAAS平台,如果使用公有云独有的PAAS平台,将变相被云厂商绑架,未来云的迁移、合同续签的议价空间会受到影响,建议慎用。
公有云提供IAAS、PAAS服务的同时,并不提供所有针对PAAS平台维护的服务,如使用MYSQL数据库,当数据库发生慢请求时,依然需要自有管理员进行管理,云厂商一般不提供针对数据库的优化建议。同样,上了云后,结合应用的实际情况,具体需要哪些安全的服务,需要企业自身结合自己情况进行选择,启用安全服务后,主要是配置运维的工作,对技能要求相对较低。
综上,采用公有云,对自有人员的能力要求主要在安全、数据库以及中间件的部署及管理方面,自有机房对各方面要求较高。
管理能力 |
自建机房 |
共有云 |
网络管理 |
高 |
低 |
安全管理 |
高 |
中 |
主机管理 |
高 |
低 |
机房运维 |
高 |
低 |
数据库管理 |
高 |
高 |
中间件管理 |
高 |
高 |
4、小结:
是否上云的选择看似是技术选择,实则与公司的业务发展阶段、所处行业、业务规模息息相关,需结合自身实际及未来3~5年发展的预期选择相应策略。
对大多数中小型企业尤其是互联网企业来说,上云可以减少初始建设及运维人员的投入,减轻短期的资金压力。
二、上云的主要工作及注意事项
1、结合自身情况,选择靠谱、高性价比的云服务商
抛开价格,大厂普遍是个比较好的选择。每家云厂商有自己的特点,如果自有技术运维人员比较薄弱,大厂是个比较好的选择,整体云平台的技术先进性、客户的规模是稳定性的重要保障。我们曾经选过某平云厂商,服务器、数据库、中间件、网络的稳定性、配置的合理性都可能会出现问题,虽然频次不高,但出问题经常在半夜,自己担惊受怕,解决也比较困难。
应用中相对较少使用的技术要提前沟通。我们的应用场景涉及到ClickHouse数据库,部分云厂商不提供此服务,单独提供价格非常高,这种情况下,应用的稳定性比较难保证,要么你自己很牛,要么选别人吧。
一定要清楚自己想要什么。如果自己不清楚应用的特点和需求,厂商不太可能给到你合适的方案和报价。
2、服务很重要
如前所述,出现问题的时候如何能快速找到相应的人,定位并解决问题非常重要,每个云厂商服务的方式不同,需要提前有个心理预期。
序号 |
云厂商 |
服务方式 |
1 |
金山 |
7*24小时微信客服群;可电话找到具体负责的技术人员 |
2 |
腾讯 |
|
3 |
阿里 |
在平台提交工单,客服7*24小时,解决问题通过钉钉联系 |
4 |
华为 |
1,官网提交工单5-10分钟内响应 2,可拨打24小时400技术客服转接研发人员 |
三、跨云迁移的问题
1、迁移的风险预防。
虽然跨云迁移目前有成熟的方案,但是跨云迁移并不简单。产生的成本、带来系统稳定性的风险、系统服务持续性的仍是必须要考虑的事情。下图的流程对整个跨云平台迁移进行了描述,整体还是比较完整清晰的。
2、迁移服务及费用
每家云厂商不同,有些厂商自己提供迁移服务,大厂如阿里、腾讯会找生态伙伴提供迁移服务,具体的服务质量还没有体验。
迁移涉及的费用包括工具费用、专线费用、临时多云共活等产生的成本。此部分成本与迁移服务器、数据量的大小相关,每个项目单独评估。
部分代理上提供免费迁移的服务,但羊毛一定会出在羊身上。
一般情况下,迁移周期大概在一个半月到两个月,试现有文档完善度、系统应用复杂程度、切换过程是否可以停服、数据量大小、带宽大小等多种因素影响。
写在最后
高速发展的云服务给中小企业尤其是初创企业带来福音,避免了前期高额的投入,但随着企业的发展壮大,依然建议每隔一段时间从业务规模、投入产出、未来预期等角度评估一下是否自建机房、IDC托管还是继续用云的方式,以保证最有的性价比。
初期做好选择,过程非必要不切换,毕竟切换必然伴随着成本和稳定性风险。
欢迎大家多交流并进行斧正。