华为云立体运维解决方案——云上一站运维平台
2019年7月10日 18:00:03
随着越来越多企业上云,云上的规模与复杂度日趋增长,对云上的运维,也提出了新的挑战。华为云在实践中演进并构建了一套完整的面向云上应用的立体化运维系统,,融合了华为云的应用运维服务(AOM)、应用性能管理服务(APM),对虚机、存储、网络、数据库及应用等多维度实时监控,并通过应用与资源告警关联、日志分析、智能阈值、分布式调用追踪、手机APP异常分析等技术,实现分钟级问题快速诊断和修复,保障云上应用长稳运行。下面以一个典型的云上应用架构为例,分享华为云立体运维解决方案。
常见的云上应用的架构
云上应用早期较多的是购买云服务I层资源(多为基础设施如主机等计算资源)自建各种集群,运维人员多以主机监控为中心进行运维,同时自己搭建应用及数据库等监控系统进行应用层和业务层运维。随着容器技术的普及,越来越多的企业通过微服务框架开发,业务的实现也更多的使用云上服务,如分布式中间件,函数服务,AI服务等,同时运维也转向云上的运维服务。以下是一个典型的现代云上应用架构:
经过域名解析阶段后,静态资源命中CDN后直接返回,无命中时会回源去拉取,动态请求直接访问WEB服务,在请求到达四层和七层ELB之前,多数企业应用也会选择WAF来清洗异常流量。
经过ELB后,请求到达业务应用服务器,业务实例多为分布式构架,微服务之间相互调用,一般情况下企业运维人员较多的关注点是应用实例这一层,多为企业自行开发的服务。
持久化层当前各CSP提供的中间件不一样,华为云上用户使用较多的如分布式缓存,分布式数据库等。由于提供动态扩容及较高级别的SLA,越来越多的企业不再需要专业的DBA,转而使用云上的服务,开发上也更加敏捷。
如此多的云服务和各种资源,任何一个环节出现问题,都将导致应用KPI异常,用户体验下降,进而导致企业运营受到影响,而每个使用云服务的企业,如