- 博客(9)
- 收藏
- 关注
原创 Docker常用服务汇总
鉴于从网络上寻找的Docker服务启动命令大部分都不能符合自己的要求,于是根据实际的工作需要,整理了如下服务的规范启动命令。
2023-10-24 10:11:28
171
原创 Nginx健康检查告警
A企业产品经过商业广告的精准运营和加速迭代,逐渐适应了市场的需求,成为了消费者出差旅行中必不可少的伙伴。每天的业务高峰和低谷都维持在比较稳定的频率中,但在业务高峰期,经常有研发反馈自己的业务,部分应用的接口有异常现象出现,影响用户体验和收益指标。运维经过排查后,最终发现是Nginx集群下的某些业务实例已经无法访问,却还在负载中接收请求,从而导致异常。
2023-10-24 09:56:48
771
原创 DNS全局流量调度
随着业务的高速发展,A企业对产品的口碑和用户体验尤为关注,而良好的用户体验离不开基础设施的稳定性建设。当前A企业是单数据中心架构,由于该架构的局限性,数据中心出现故障后,业务无法立即恢复,会直接影响到用户访问,而运维团队也一直以来处于被动应急模式,是研发中心稳稳的背锅侠。鉴于此,运维中心总监结合现状向CTO提议,为提高业务稳定性,建议实施双中心建设项目,由两个数据中心共同承担业务流量,互为热备,故障时可以进行流量调度,尽快止损。
2023-10-24 09:55:14
284
原创 自动分发SSH秘钥
企业A新入职了一位资深网络管理专家,经过一周的了解,发现公司现在的网络情况非常糟糕,所有的同事都可以从线下办公网访问线上生产服务器进行操作,有稳定性风险。现在网络组要进行网络权限隔离,使线下不能直接访问线上,影响运维的日常生产问题排查。于是,组长和网络管理人员对此事进行沟通,最终结论是网络组给运维组开放一个访问入口,让运维组申请2台服务器作为中控机并申请办公网访问权限,以后访问生产的机器都要先登录任意一台中控机,然后在SSH到目标主机上。
2023-10-24 09:51:34
110
原创 shell爬取51cto指定用户的文章标题和地址
企业A最近新招了一批应届生,分了3个新同学到运维组,组长吩咐小李带这3个新同学,尽快熟悉基础知识和日常操作。小李带新同学入门运维非常有经验,但苦于时间有限,不能全身心投入,于是想先找一些资料,让新同学对运维有个大概的了解。
2023-03-20 10:13:50
209
原创 Nginx动态负载均衡与配置管理
在Nginx集群有一定的规模时,比较让人头疼的问题有2个,一是如何在不reload nginx的情况下,动态更新后端rs,减少nginx reload的性能损耗,也能更好的对接到内部的部署平台;二是如何标准化的修改nginx配置并下发,统一对配置进行管理。.....................
2022-08-29 14:48:45
2551
原创 执行nvidia-smi命令报Failed to initialize NVML: Driver/library version mismatch错误
Failed to initialize NVML: Driver/library version mismatch
2022-05-27 15:17:59
6580
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人