云平台实践与运营可靠性指南
1. 云项目中的常见问题与反模式
在云项目推进过程中,常常会遇到一些问题与反模式。比如,曾有一个产品团队聘请我加速其云项目,然而我们却要等一个月才能访问云环境,原因是运维开发(DevOps)团队并未将此列为优先事项。该公司的基础设施团队虽改名为 DevOps,但并未与产品团队协作,导致了不必要的等待时间。这与 DevOps 运动倡导的创建更具协作性的环境相悖。
另外,DevOps 的另一个原则是自动化,但在自动化所有流程之前,应重新评估当前流程。当软件架构不佳时,通常不可靠,会导致大量计划外工作。随着快速修复的累积,架构会持续恶化,这被称为“最终架构”。类似地,流程也会出现“最终流程”的情况,随着时间推移,流程会变得难以管理,人们虽知道其低效,却不敢轻易改动。因此,在考虑自动化流程时,进行价值流映射练习,了解流程的端到端流动以及低效之处是很有必要的,避免自动化本不应执行的流程。
2. 云平台最佳实践
为了让云平台创造商业价值,有以下几个最佳实践值得借鉴:
- 采用产品思维
- 平台应赋予开发者自助服务能力,让他们能够部署和运营自己的服务。这与过去开发者需通过基础设施和运营团队才能完成工作的方式有很大不同。
- 运营团队应专注于提供可靠的服务,而不参与平台上应用程序的运营。重点是为开发者构建强大的服务目录,并将安全(包括安全、合规性、成本控制)融入平台。
- 开发者使用平台服务的体验应简单便捷,新开发者的入职流程应简单,同时提供充足的培训,平台团队应与开发者协作,优化“客户”体验。
- 采用云服务提供商思维
超级会员免费看
订阅专栏 解锁全文
838

被折叠的 条评论
为什么被折叠?



