
自动化运维
文章平均质量分 80
睿江云计算
这个作者很懒,什么都没留下…
展开
-
运维人员踩坑记录之总是被忽略的NFS难题
场景某一天晚上,小明的手机突然收到一堆短信,他很是奇怪,现在的人应该基本都是玩微信,谁还玩短信这么无聊,小明随之一看,当场吓了个半死,是一堆服务器宕机的告警!难道机房被火力攻击了吗?冷静,冷静,小明忍住心慌,打开了电脑,然后打开自己平时用来测试服务器网络的脚本,咦,网络全通,然后再远程服务器看看,发现远程正常,防火墙正常,SNMP服务正常,应用服务正常,但告警短信还是不停的发过来。恐怖如斯!不过小明是见过大场面的运维,他很想直接关手机,然后睡觉,但是运维的职业精神引导着他打开了监控服务器,经过一系原创 2021-04-02 10:34:21 · 246 阅读 · 0 评论 -
官方工具Ceph-deploy部署chenlc
前言Ceph是优秀的分布式存储集群,可以为云计算提供可靠的存储服务,本次作者示范部署ceph存储集群,使用的系统ubuntu18.04.2,部署的ceph版本为Luminous,即Ceph 12.x。本次的范例是使用ceph的官方工具ceph-deploy进行部署服务。由于ceph的使用条件苛刻,不推荐在生产环境使用云主机部署,所以本次的部署测试使用睿江云的云主机部署服务是一个合适的选择。先说明下搭建环境与各主机角色。机器选择:睿江云平台节点选择:广东G(VPC网络更安全、SSD磁盘性能高)云主机原创 2021-02-02 18:02:26 · 752 阅读 · 0 评论 -
如何使用性能分析工具观察cpu性能指标
前言:为了更好配置分布式储存集群的运行参数,使用性能分析工具观察业务环境是一种必要的手段op 或者 uptime02:34:03 //当前时间up 2 days, 20:14 //系统运行时间1 user //正在登录用户数load average: 0.63, 0.83, 0.88依次则是过去 1 分钟、5 分钟、15 分钟的平均负载(Load Average)平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均原创 2021-02-02 16:13:51 · 255 阅读 · 0 评论 -
简单分析实现运维利器---webssh终端
背景现在几乎所有东西都向往着自动化,在运维界更是如此,运维人员都向往自动化代替人工操作、解决人工操作大量重复性工作的问题、故障主动恢复:及时发现;流程;解决。运维规范化:角色定义和责任划分、流程化等。但这些种种的目的,都离不开非常细小的技术支持,下面我们就来讨论如何搭建一个自动化运维平台,本文先讲一讲运维平台较重要的技术之一的webssh。一、技术选型&实现思路1.后端逻辑,选用:Django框架2.模拟web终端,选用:xterm3.实现远程主机连接,建立ssh通道,python库:pa原创 2020-11-17 09:56:39 · 1109 阅读 · 2 评论