为什么IT运维需要自动化?
所谓IT运维管理的自动化是指通过将日常IT运维中大量的重复性工作,小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度,由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟,实现“零延时”的IT运维。简单的说,IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助IT运维人员完成日常的重复性工作(如备份,杀毒等),提高IT运维效率。同时,IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。
运维应包括如下:
环境定义:开发环境、测试环境、类生产环境、生产环境等。
部署:能够将部署包有效的部署到不同的环境。
监控:能够监控部署后的系统和应用。
告警:出现问题时的响应和处理机制。
性能优化:系统各个服务如Nginx/Java/PHP/DB/网络的优化。
SLA保障:通常要和业务相关部门讨论确定。
服务治理、任务调度、集群协同、调用链分析、接口质量、SQL质量、实时日志等
打包、自动化测试、检测、灰度发布、分区上线、运维自动化、配置标准化、指令标准化等
分布式框架、存储&缓存中间件、自动化测试、云搜索、开放平台、营销平台等基础设施
自建技术基础设施(开源+自研)
依赖开源的技术栈
开发阶段Code/build 测试阶段Test/ci 上线阶段Release/deploy 运维系统Monitor
服务治理Service •运营平台Channel •|-推送平台Push
1、分布式服务架构
服务发现、通信、控制
2、运维研发的自动化体系
运维配置标准化3大层次
•2.1、硬件标准化:
2.1、硬件标准化—自动化采集
2.2、软件标准化—统一软件规格
2.2、软件标准化—自动化安装卸载
2.2、软件标准化—服务自动管理
2.2、Nginx标准化—自动配置300域名
3、项目发布自动化体系 •3.1、代码发布系统
4、服务治理体系
4.1、服务健康状态检测
4.2、分布式任务调度Schedule
分布式调度中心:
4.3、调用链分析Cat
4.4、实时日志监测(雷达系统)
•实时日志查看
4.4、实时日志监测
4.6、SQL质量治理(Monyog)
5、测试环境的自动化构建
6、自动化测试
自动化测试—API自动化测试
自动化测试—Web自动化测试
自动化测试—Mock模拟测试
出处:http://www.cnblogs.com/wintersun/p/5059097.html