个人愚见,抛砖引玉。
我的理解,在运维工作中使用python,并不是说“简单的命令行操作”就能解决的东西,或者写个bash shell、powershell、bat脚本就能解决的东西,都必须转换成用python来解决。
更加不是说必须抛弃已经熟练掌握的技能,然后使用完全不熟悉的技术栈(python)来做运维,舍近求远,本末倒置。毕竟,个人理解,运维首先追求的应该是稳定,其次才是效率,创新。
相反地,python应该是“命令行”与“脚本”的补充,专门用来解决这两者无法解决的东西与问题的。更甚者,由于python有各种的第三方库,可以写桌面GUI程序、可以写WEB、可以写爬虫等等等等。因此,我觉得使用python来做运维,最终极的目标可能是“让不会运维的人都能运维”。
为啥要“让不会运维的人都能运维”?因为现实运维工作中,就分了外包人员与正式员工,而外包可能还分为服务台、一、二、三线工程师,正式员工也分助理、中级、高级等不同级别的工程师,每个岗位对人员的要求、对知识的掌握与熟练程度都是不一样的(当然对应薪酬也不一样)。所以有些时候你又不能直接给服务台或者外包的一线工程师登录服务操作的权限(否则万一真在服务器上跑rm -rf /怎么办),但又有些简单的、重复劳动的体力活想要他们来替你承担,而厂家产品自带的工具里面又没有这个功能,那怎么办?
答案就是自己Devops开发,开发出一个具有图形化界面,易用性足够简单的运维工具,来让“让不会运维的人都能运维”。
终极目标:让不会运维的人都能运维
例如我弄过这样一个东西(用“腾讯蓝鲸”的python+django框架+html/css/jquery做的),公司购买了一个软件产品,软件许可(技术授权)没有买全所有用户,每个用户登录后就占用一个用户许可,一旦占满许可之后,后面的用户就无法登陆了,需要管理员手动清空当前的用户许可占用。
然后我就开发了一个下面这样的WEB工具,外包一线的工程师收到用户无法登陆的工单,并且判断是许可不足之后,就点击一下“刷新授权”的按钮。

系统自动弹层授权刷新中,

然后,页面自动刷新“状态”字段会显示任务“进行中”还是“已完成”。

服务器侧,授权占用数量自己慢慢就下去了。


任务完成后,自动显示“状态”为“已完成”。

整个操作过程,一线工程师不用登陆服务器,而且,易用性简单到爆炸,点击一下“刷新授权”按钮就足够了。就算换了个一线工程师,他根本不需要掌握任何实质性的技能,只需要根据KB指引,点击一下就可以了,从而达到“让不会运维的人都能运维”。
如何做到足够的易用性,我认为需要图形化界面的支持(无论是WEB还是GUI),然而“命令行”与“脚本”都做不到,但python却有丰富的框架可以做图形化WEB界面(例如Django、Flask等),而且python入门比较简单,所以很适合运维人员用来开发一些运维工具。
再来一些自己做过的案例:
1、对接短信网关/微信接口,实现监控系统短信告警
基本上所有开箱即用的软件产品(例如solarwinds、zabbix、ITSM系统等),默认都会配置有邮件、短信、部分还有微信通知/告警。
相当一部分的运维工程师都只会配上邮件通知/告警,因为邮件通知/告警的配置简单以及无成本,基本上只要在软件上配置SMTP服务器IP地址,端口(SMTP默认端口25),邮箱账号名,密码,就可以了。
然而很多业务场景,邮件通知/告警实时性根本是不够的。(例如监控系统的故障告警,有时候邮件没看就错过了,至少也要短信告警,最好是电话告警)
为什么不做短信告警呢,1是因为涉及要与运营商短信网关/短信接口的对接,就需要写代码,将接口要求的参数,按照接口的规定的格式,传输给接口。2是参数哪里来呢?当然是从需要发送短信告警的软件系统中接收的,而不同的软件产品,输出的参数命名、参数数量、格式(如XML、JSON)又不一样,所以又是要写代码对接。
而因为一般运维工程师都不会写代码,所以基本上短信告警就黄了。(微信告警同样)
而当你会用python,这个东西弄起来其实就很简单了。譬如之前,公司买了H3C的网络设备统一管理平台(IMC),里面可以纳管所有H3C的网络设备,并且具备监控与告警功能。IMC上面的短信告警配置,默认使用POST请求提交数据,能够填写接口url地址,并且使${mpNumber}表示接收告警短信的电话号码,${smsContent}表示短信内容,具体内容IMC会根据不同的告警对象与问题进行填充。
而公司在用的短信API,则要求调用方将参数按照JSON的格式输入,有userid,password,phone,content四个变量需要输入,所以IMC的输出的参数命名、数量、格式与短信网关接口的输入格式、参数不匹配,无法直接对接,怎么办?
于是我就用python+django起了个web服务,做了一个接口,在IMC上面配置POST请求往我的接口发送,我的接口负责接收IMC传输过来的${mpNumber}与${smsContent},将其连同userid、password整理为JSON格式。
#伪代码
(
'userid':'xxxx',
'password':'xxxx',
'phone':${mpNumber},
'content':${smsContent}
)
然后调用公司的短信接口,将参数传输过去,就完成IMC与短信接口的对接,实现监控系统实时短信告警了。
更加有意思的是,我开发这个功能,用非工作的业余时间开发了2天(我承认我开发水平很渣,这么简单的东西弄了那么久)。而在收到需求的第一天上午我们也找H3C厂家询价了,在第2天晚上我开发出来之后,H3C厂家回复这个与短信接口对接的需求,属于个性化需求,需要定制开发,报价7万元。所以某种程度上,我两天业余时间的开发,赚了7万块钱。而这个需求,通过“命令行”与“脚本”,应该也是解决不了的。
2、写爬虫,帮领导自动填报数据
工具化运维,一般都会建很多烟囱式的系统,不同的人管不同的系统。而一旦要统计各个系统的运维数据,就需要人手一个个系统登录,查询数据并且记录,然后汇总到表格里面。如果只是每月、每周采集一次,可能还好,而如果每天都要填报,系统又多,每天就要花费专门的时间处理这个重复劳动又吃力不讨好的工作。
领导觉得很烦,于是又要我开发个自动采集的功能,这个东西“命令行”与“脚本”应该也是无法解决。最好的方法应该是调用各个系统的接口直接取数,如果不行可能次优方法是直接读各个系统的数据库视图取数,而如果这两个方法都不可行,那么只能硬来,通过爬虫模拟人的正常访问行为,自动访问网页,填写用户名密码,模拟点击操作,然后读取相关的数据,写入数据库或者EXCEL表,再FTP上传到指定位置。
于是我用python+selenium,使用chromedriver,用爬虫打开chrome浏览器,然后自动爬取数据入库,让该系统直接从我数据库读取相关的数据,就不用自己填报了。
所以我相信python是运维除了“命令行”与“脚本”之外的一个强大补充,为运维自动化、DevOps、AIOps提供了更多的可能性。
关于Python技术储备
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、Python必备开发工具

三、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

四、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、Python练习题
检查学习结果。

六、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

最后祝大家天天进步!!
上面这份完整版的Python全套学习资料已经上传至优快云官方,朋友如果需要可以直接微信扫描下方优快云官方认证二维码免费领取【保证100%免费】。

文章讨论了如何在运维工作中利用Python,强调其作为命令行和脚本的补充,用于解决复杂问题和提升易用性,如图形化运维工具、短信告警接口对接和自动化报表填报。作者分享了Python在DevOps和AIOps中的应用实例,并提供了一份Python学习资源清单。

被折叠的 条评论
为什么被折叠?



