自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 Linux常见服务与云原生运维常见服务报错与解决方案

日均处理日志量可达TB级。如果使用的是私有仓库,确保 Kubernetes 配置了正确的凭证(通过 Kubernetes Secret 或 Docker Config)。在 GitLab CI/CD 流水线中,推送镜像到 Docker registry 时,可能会遇到认证失败或推送超时的问题。优化 Dockerfile,避免频繁无变化的步骤,比如将频繁变化的命令移至 Dockerfile 的后面。确保 Dockerfile 中的路径、文件名和基础镜像都正确,并且必要的环境变量已正确配置。

2025-03-18 21:20:54 1334

原创 基于Kubeadm实现K8S集群扩缩容指南

缩容注意事项确保所有非DaemonSet Pod已被驱逐,避免业务中断。重置节点后需清理残留数据,防止敏感信息泄露。扩容注意事项Token有效期:默认24小时,--ttl 0设置为永久有效。确保新节点与Master网络互通,防火墙放行6443端口。常见问题排查节点无法加入:检查Token有效性、时间同步、网络连通性。节点状态非Ready:等待网络插件(如Calico)自动配置,检查kubelet日志:journalctl -u kubelet -f

2025-04-10 20:46:01 1182

原创 真实企业级K8S故障案例:ETCD集群断电恢复与数据保障实践

备份策略:必须遵循3-2-1原则(3副本、2种介质、1个离线)3-2-1原则的落地实现# 多介质备份示例(本地磁盘+对象存储+磁带)3副本:本地磁盘(SSD)、AWS S3 Glacier、LTO-8磁带2种介质:电子介质(云存储)+物理介质(磁带)1个离线:每周人工更换磁带并转移至防爆保险柜备份生命周期管理# 自动清理旧备份(保留策略)热备份保留7天冷备份保留30天归档备份保留5年断电防护:UPS容量需按实际负载的150%配置数据验证:每次备份后必须执行监控覆盖。

2025-04-10 09:39:38 998

原创 运维网络排查工具介绍与使用

在一年半的运维实践中,最常遇到的难题往往是故障定位不准确。多工具互补:抓包工具适合数据层细查,而 telnet、ping 等工具则快速验证网络连通性;ss 和 nc 可以进一步验证端口和进程状态。结合使用能更快定位问题。日志与数据包同步:在排查过程中,总要和系统日志、应用日志相结合,确认是否存在策略更新、应用异常等因素。学习与积累:每次故障处理后,我都会总结经验,建立一份常见故障及处理方案的文档,以便快速响应类似问题。这不仅提高了解决问题的效率,也让我对网络协议和各工具的使用有了更深的理解。

2025-03-26 22:41:21 1089

原创 使用 Ansible 维护中小互联网企业 55 + 台服务器的实战经验

通过这一年半的运维经验,我深刻体会到了 Ansible 在服务器维护中的强大功能和重要性。它不仅提高了我的工作效率,还降低了人为失误的风险,保障了业务的稳定性。同时,也让我在自动化运维、DevOps 流程和安全管理等方面有了更深入的理解和实践经验。

2025-03-26 22:26:30 650

原创 传统应用容器化迁移实践

在过去的运维工作中,某企业一直依赖于传统的物理机和虚拟机部署方式。资源利用率低:物理机和虚拟机资源分配固定,导致资源利用率普遍偏低,部分服务器长期处于高负载状态,而另一些服务器却闲置。部署复杂且耗时:每次应用部署都需要手动配置环境,耗时长且容易出错,尤其是在高峰期的紧急部署中,效率问题尤为突出。扩展性差:面对业务高峰期的流量波动,传统的垂直扩展方式无法快速响应,导致资源浪费和用户体验下降。

2025-03-26 22:05:11 986

原创 企业级Linux服务器初始化优化全流程

通过以上系统化配置,某电商平台服务器稳定运行时间从89%提升至99.99%,运维效率提升40%。记住:没有放之四海皆准的配置,所有优化都要以实际业务监控数据为依据!本文基于某电商平台百万级并发服务器的真实调优案例整理,所有操作均在Rocky Linux8.5验证通过,不同发行版请注意命令差异。:某金融公司新采购的服务器因未做安全加固,上线2周后遭SSH爆破入侵。:修复CVE-2021-4034等12个高危漏洞,系统漏洞减少83%:同步误差从±300ms降至±0.5ms。:某直播平台优化后支撑5万并发推流。

2025-03-26 21:48:34 424

原创 Harbor镜像仓库迁移与高可用集群搭建&&HTTPS实现实战指南

本次技术实践采用基于Harbor的高可用架构设计,同时构建跨数据中心的镜像同步机制,现就架构方案与实施要点进行技术复盘。在大规模迁移场景中,合理运用Harbor的智能化GC与分布式复制能力,可使PB级仓库迁移效率提升300%以上,为云原生转型提供坚实基础设施保障。这时候我们的高可用架构已经搭建完成了,我们只需要同步一下两个harbor的镜像仓库的镜像数量就可以了。通过本文方案,可实现企业级镜像仓库的无缝迁移与高可用保障,支撑容器化业务的稳定运行。进入"项目" → "新建项目",输入项目名称(如。

2025-03-24 21:21:18 1192

原创 企业磁盘管理实战:常见问题与高效解决方案

测试服务器运行多个内存密集型应用时,物理内存耗尽,系统频繁触发Swap交换机制。由于Swap分区不足,测试任务卡顿甚至中断,但物理内存无法临时扩容,需快速缓解内存压力。遵循“内存≤8G时Swap=1-1.5倍内存,内存>8G时Swap≤8G”原则,避免过度依赖Swap影响性能。初步排查发现磁盘空间或inode耗尽,需快速定位并清理大文件。通过上述方案,可系统性解决企业级磁盘管理中的高频问题,保障业务稳定运行。,单文件达10G,系统盘空间告急。需保证日志路径不变,且业务不中断。定位占用进程,释放资源。

2025-03-22 17:46:18 262

原创 K8S遇到过的比较深刻的Pod问题

通过以上措施,广告投放服务的Pod驱逐问题得到了有效解决。建议在日常运维中,定期检查Pod资源配额和驱逐策略,确保系统在高负载情况下能够稳定运行。凌晨的机房,咖啡已经凉透。看着逐渐平稳的监控曲线,突然想起前辈的话:"K8s故障就像冰山,你看到的Pod异常只是露出水面的一角。" 下次大促前,或许我们该在资源限制里多留20%的缓冲,就像给代码写注释一样——不是为了当下,而是为了那个在深夜紧急处理故障的,未来的自己。

2025-03-21 19:07:41 1137

原创 Docker与K8S是什么&该怎么选?

Docker和K8S就像螺丝刀和电动工具箱:前者简单直接,后者功能强大但复杂。

2025-03-21 17:47:46 937 2

原创 zookeeper&nacos&kafka之间的联系

ZooKeeper与Kafka:经典组合但正在解耦,理解其协作机制有助于优化现有集群。ZooKeeper与Nacos:非替代关系,而是互补。选择时需权衡一致性、易用性和生态兼容性。架构设计:没有银弹,需结合团队技术栈、业务场景和长期运维成本综合决策。

2025-03-19 22:24:22 1144

原创 Zookeeper 集群部署与管理实践

Zookeeper 是 Apache 基金会开源的一个顶级项目,主要用于分布式集群的协调服务。其应用场景包括配置中心、注册中心、服务发现等。Zookeeper 作为分布式系统的协调服务,在企业中有着广泛的应用。通过合理的配置和管理,可以确保 Zookeeper 集群的稳定运行和高可用性。在部署和使用 Zookeeper 集群时,需要注意网络配置、防火墙设置、节点数量等关键因素,以确保集群的可靠性和性能。

2025-03-19 22:14:09 985

原创 Kafka集群部署实战

Kafka 作为一种高性能的分布式消息队列系统,在企业中有着广泛的应用。通过合理的配置和管理,可以有效地利用 Kafka 的特性,满足企业对大规模数据流处理的需求。在部署和使用 Kafka 集群时,需要注意网络配置、主机名解析等问题,以确保集群的稳定运行。

2025-03-19 22:03:57 909

原创 Nacos集群部署与高可用架构实战指南

在微服务架构中,配置管理和服务发现是至关重要的。Nacos 作为一款开源的动态配置和服务发现工具,能够帮助我们实现这些功能。本文将详细介绍如何部署 Nacos 集群,并结合 HAProxy 和 Keepalived 实现高可用。本文详细介绍了如何部署 Nacos 集群,并结合 HAProxy 和 Keepalived 实现高可用。通过以上步骤,我们能够确保在生产环境中 Nacos 的稳定运行,为微服务架构提供可靠的配置管理和服性能调优参数1. JVM参数优化# 修改bin/startup.sh。

2025-03-19 21:20:03 763

原创 关于Docker是否被淘汰&虚拟机实现连接虚拟专用网络&Ubuntu 22.04 LTS部署Harbor仓库全流程

1.今天的第一个主题:第一个主题是关于Docker是否真的被K8S弃用,还是可以继续兼容,因为我们知道在去年的时候,由于不可控的原因,docker的所有国内镜像源都被墙了,再加上K8S自从V1.20之后,宣布启用docker作为唯一的容器管理工具,很多人都觉得Docker被启用了,那么接下来我来简单阐述一下我自己的观点。

2025-03-19 20:48:32 1324 3

原创 传统服务部署、虚拟化部署与云原生部署资源消耗对比与优化指南

定义:直接运行于物理服务器或基础Linux操作系统环境,无虚拟化层隔离特点资源独占(CPU/内存/磁盘)部署流程简单但扩展困难典型场景:单一业务高负载场景(如数据库服务器)# 示例:传统部署的top命令输出(物理机资源独占)初创企业:优先采用云原生方案(如Serverless),避免前期硬件投入传统行业:逐步将非核心业务迁移到虚拟化平台互联网公司:全面拥抱Kubernetes体系,建立CI/CD流水线关键业务系统:保留物理机部署保证性能稳定性# 资源分配决策流程图(伪代码)

2025-03-18 20:20:42 956

原创 ansible学习自用笔记

Ansible是一个自动化统一配置管理工具,自动化主要体现在Ansible集成了丰富模块以及功能组件,可以通过一个命令完成一系列的操作,进而能减少重复性的工作和维护成本,可以提高工作效率。功能描述配置管理自动化系统、软件、服务的安装和配置,确保多主机间配置一致性。应用部署自动化应用程序的部署和版本管理,包括支持滚动更新和回滚。任务自动化在多主机上并行执行任务,如文件操作、服务重启、软件更新等。多主机管理支持跨平台管理(Linux、Windows、macOS),可根据主机组批量执行任务。基础设施即代码。

2025-01-15 14:43:03 351

转载 kylin V10 SP2 OR SP3安装zabbix

麒麟系统V10安装Zabbix6.0详细步骤_麒麟系统安装zabbix-优快云博客

2025-01-08 18:46:18 49

原创 Nginx+keepalived高可用自用笔记

负载均衡和高可用性常常一起使用,以确保系统不仅能处理大量并发请求,而且在任何单点故障发生时都能保持正常运行。例如,负载均衡可以在多台冗余服务器之间分发请求,而高可用性机制保证如果某个服务器故障,系统能自动切换到其他服务器。总结来说,负载均衡优化系统性能和流量分配,高可用性则保证系统的容错性和持续服务能力。:负载均衡通常依赖于代理、负载均衡器、DNS等技术,而高可用性则通过冗余、故障转移、数据备份等技术实现。:负载均衡的目的是优化流量分配,提高系统处理能力,而高可用性的目的是确保系统在故障时仍能正常运行。

2024-12-24 21:49:20 856

原创 Linux中web服务之Nginx最全最易懂学习(附图文结合)

Nginx(发音为 "Engine-X")是一个高性能的 web 服务器、反向代理服务器和负载均衡器。它最初是为了应对高流量的网站而设计的,特别适合处理大量并发连接。下面是简单易懂的介绍:1. Web 服务器Nginx 可以用作 web 服务器,也就是它负责接收用户的 HTTP 请求并返回网页内容。比如,当你在浏览器中输入网址(如 `www.example.com`)时,浏览器会发送 HTTP 请求给服务器,服务器通过 Nginx 返回网页。

2024-12-18 08:20:53 1292

原创 已解决编译安装源包没有Makefile文件的问题

工具生成必要的配置文件,包括。如果在源包目录中没有运行。对于 PHP 扩展,使用。

2024-12-12 17:45:04 433 1

原创 纯新手一样能看懂什么是HTTP?

HTTP(HyperText Transfer Protocol,超文本传输协议)是一种用于在客户端和服务器之间传输数据的协议。通常,HTTP用于浏览器(客户端)与Web服务器之间的通信。HTTP 服务就是指一个Web服务器(如Apache、Nginx)在某个端口(默认是80端口)上运行并提供HTTP协议的服务。客户端可以通过HTTP请求获取网页内容,服务器则返回响应。HTTP服务概念描述HTTP服务HTTP是用于客户端与服务器之间传输数据的协议,通常用于浏览器与Web服务器的通信。

2024-12-09 08:19:31 1140 1

原创 Linux中kdump的认识

当 Linux 内核发生严重错误(如内核恐慌,kernel panic)导致系统崩溃时,kdump 能够捕获此时系统内存中的数据,并将其保存到磁盘上的指定位置。这些捕获的数据被称为崩溃转储(crash dump),它包含了系统崩溃瞬间内核的状态信息,如进程列表、内存映射、寄存器值等内容。在我们使用RedHat以及RedHat衍生的操作系统时,我们明明给虚拟机分配了假如说4G的ram内存,但是我们实际查看时,却总是少了一点(一般为1G),这是因为Linux中kdump的作用。

2024-11-04 14:55:07 643

原创 基础网络学习

网络模拟器使用eNSP本文章全是自学自用,有指点的地方可以留言...

2024-10-14 17:57:04 292

原创 Linux磁盘内存管理——自用笔记

两者结合使用,可以在保证数据可靠性的同时,提供灵活、高效的存储管理解决方案。的物理卷,创建卷组和逻辑卷,从而实现既有冗余、性能又灵活的存储。提供了灵活的存储管理能力,可以动态调整存储空间并创建快照。通过组合多个磁盘来提高数据冗余和性能。因此我们要格式化一下,也可以说是刷新一下。可是这时候我们发现好像并没有发生变化。流程:物理硬盘(分不分区都行)->卷组中抽调空间,制作逻辑卷 (LV。提供的冗余性和性能,结合。lvm逻辑卷操作流程。

2024-10-14 14:14:15 209

原创 Ubuntu 22.04 LTS 下安装Zabbix6.0 LTS

Zabbix 6.0采用All-In-One方式apache 2.4.52(这里采用apache的方式,使用nginx也可,原理相同)配置源文件首先备份一下原来的然后修改更新源。

2024-07-18 16:06:21 613

原创 一个配置文件看懂nginx简单的ssl加密、反向代理,负载均衡、HTTP重定向技术

https://help.aliyun.com/zh/ssl-certificate/user-guide/installation-overview

2024-06-14 14:29:41 488 3

原创 基于Ubuntu22.04操作系统部署k8s1.28集群

配置cgroupdriver&&containerd为systemd && 安装containerd&&配置crictl。修改host文件&&关闭防火墙&&配置时间与时区&&关闭 Swap&&开启IPv4转发(三个节点)tips:此步骤只需要master节点进行即可。tips:以下操作三个节点都要完成。出现successful。tips:三个节点都要完成。tips:三个节点都要做。

2024-05-25 10:46:45 888 1

原创 ubuntu使用root身份远程连接报错Access denied

:禁止root用户通过SSH登录。这是一种安全措施,可以防止未经授权的用户直接使用root权限登录到服务器,从而减少潜在的安全风险。我们只需要把上图标注两行内容注释删掉把PermitRootLogin后更改为yes,然后刷新一下远程连接,重新输入信息即可连接。出现问题:使用Ubuntu远程连接xterm一直报错Access denied,明明设置的root密码是正确的。3.如果是服务器,需要检查服务器安全设置,确保本地主机被允许连接。2.确保防火墙配置没问题,不会阻止。1.查看网络并没有问题2.

2024-05-24 10:20:10 1094 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除