自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(195)
  • 收藏
  • 关注

原创 Linux LVM逻辑卷深度实操指南!怎么进行扩容缩容+快照备份?

传统磁盘分区最大的痛点是“固定大小”——初期规划的分区容量用完后,扩容需重装系统或迁移数据;容量规划过大又造成磁盘浪费。而LVM(逻辑卷管理)通过抽象物理磁盘为“弹性存储池”,实现分区在线扩容、缩容,还支持快照备份,完美解决传统分区的刚性问题。

2025-12-31 13:45:02 353

原创 绕过kubectl,直接操作K8s API的正确姿势!

开发Operator时,需要监听资源变化,有延迟,直接用API的watch# opsnot.com - 持续监听Pod事件# 生产环境应实现重连逻辑,并使用resourceVersion继续watchwhileTrue:try:= 200:continueif line:# 自动重启失败的Pod - opsnot直接操作K8s API除了性能好、灵活性强、集成方便外,在很多场景下也更为合适:1. CI/CD流水线 - 轻量、快速2. 自定义控制器 - Watch机制更高效。

2025-12-30 10:16:13 338

原创 K8s高频命令实操手册,值得收藏!

实际使用中配合tab自动补全,效率会更高。遇到复杂问题,先看events、log和describe,大部分都能找到原因。记住:生产环境删东西前一定要确认命名空间!!!

2025-12-30 10:14:55 166

原创 Kubernetes 安全配置与性能优化全景指南

最小权限:Pod、SA、RBAC、kubelet、网络策略都遵循最小权限原则。资源隔离:设置 requests/limits、命名空间、Sidecar/Init Container、日志采集等保证性能隔离。纵深防御:Pod 安全标准、内核安全模块、网络策略、镜像策略、节点安全,多层保护性能稳定。✅ 一个安全配置合理的 Kubernetes 集群,同时也是性能可预测、稳定可靠的集群。

2025-12-19 17:00:28 595

原创 一文吃透 Kubernetes 持久化存储:从 Volume 到生产级 PV/PVC 设计

在 Kubernetes 中,计算是短暂的,数据是永久的。Pod 可以随时被调度、重建、迁移,但数据一旦丢失,业务往往无法恢复。Kubernetes 为此设计了一套解耦、分层、可扩展Pod 不直接使用存储,而是通过 PVC 间接声明需求这套机制功能强大,但也因此成为:新手最难理解生产事故最多配置最容易“差一行就翻车”的模块之一本文将从原理 → 配置 → 生产实战 → 故障排查,系统性吃透 Kubernetes 持久化存储。

2025-12-19 14:20:23 518

原创 用Kubernetes Operator,将你的专业经验自动标准化!

例如实现主从选举、滚动升级、自动修复故障等。

2025-12-18 17:39:26 807

原创 执行kubectl出现报错?80%可能跟kubeconfig有关

在 Kubernetes 日常运维中,很多人都是在master节点上使用kubectl命令来操作集群的。但有时想在其他节点执行kubectl时就会出现下面的报错:这种是很典型的报错,其实就是大部分kubectl 使用问题,本质都源于对它工作原理的不理解。接下来将通过,彻底讲清楚:kubectl 到底是如何工作的为什么“不在集群里”也能操作集群。

2025-12-18 08:44:50 490

原创 从零搭建企业级K8s集群

Kubernetes已经成为容器编排的事实标准,但搭建一个生产可用的K8s集群并不简单。我第一次搭建K8s集群的时候,照着官方文档用kubeadm init,看起来很顺利,结果上线后各种问题:证书过期集群挂了、etcd数据丢了恢复不了、网络插件选错了性能很差、master单点导致业务中断…后来陆陆续续踩了无数坑,才算搞明白企业级K8s集群应该怎么搭。这篇文章就是把这些经验整理出来,让你少走弯路。•高可用是基础:3 Master + VIP负载均衡•etcd备份是保险:每天备份,定期验证•。

2025-12-08 08:41:17 994

原创 CKA认证笔记(1.28版本)

考点:pvc 的创建 class 属性的使用,--record 记录变更。请问创建Ingress服务的yaml文件全是自己手敲的吗?考点:NetworkPolicy 的创建。考点:nodeSelect 属性的使用。考点:kubectl logs 命令。官网有案例可以复制,记性好可以手搓。考点:etcd 的备份和还原命令。考点:Ingress 的创建。我的心略大于整个宇宙。我的心略大于整个宇宙。

2025-12-04 15:02:49 339

原创 记录一次虚机硬盘扩容

查看当前磁盘与 LVM 状态 使用 df -h、lsblk、vgdisplay 查看根分区、VG、LV 的实际容量,确定根分区空间不足且VG 无可用 PE。在 VMware 扩容虚拟磁盘 将磁盘容量从 100G 扩到 200G扩展底层分区 /dev/sda2 使用 parted 命令调整分区大小: resizepart 2 100% 将 sda2扩满整个磁盘。扩展 PV(物理卷) 底层分区扩展后,通过 pvresize /dev/sda2 让 LVM 识别到新增空间。

2025-12-04 14:48:40 260

原创 Docker 镜像瘦身技巧:将1GB镜像优化到50MB!

在容器化时代,Docker 镜像的大小直接影响着应用的部署速度、存储成本和安全风险。臃肿的镜像不仅占用宝贵的磁盘空间和网络带宽,还会拖慢 CI/CD 流水线,增加镜像仓库的存储成本。更重要的是,镜像越大,攻击面越大,包含的漏洞也越多。通过科学的优化手段,可以将一个 1GB+ 的 Node.js 或 Java 镜像压缩到 50MB~100MB,甚至更小,同时保持应用的完整功能。本文将介绍七种经过实战验证的镜像瘦身技术。

2025-12-04 14:01:41 929

原创 Kubernetes的15大典型应用场景:从微服务到AI,让你彻底搞懂K8s的真正价值

Kubernetes 是现代云原生架构的核心支撑。它在微服务、AI、IoT、合规、安全等场景中大放异彩,帮助企业实现高可用、自动化与可扩展。

2025-12-04 09:53:27 729

原创 快速配置Containerd镜像加速(附最新可用加速地址)

Docker下载的镜像是无法在以containerd为容器运行时的Kubernetes集群运行的,同理containerd 和 Docker 的镜像配置方式不同,Docker 的配置不会被 containerd 读取,containerd的配置文件是。如果不配置containerd的镜像加速器,拉Docker Hub镜像会非常慢,国内甚至无法拉取镜像。下面就教大家在containerd配置多个加速器,其实跟docker的加速器可以是一样的,只是配置的位置和方式有点差别。

2025-12-02 08:39:45 388

原创 程序员和运维都怕的 OOM,其实都是资源限制没整明白

Kubernetes 允许你为每个容器(Pod 中的每个容器)设置资源的 请求(Requests) 和 限制(Limits),用于指定单个容器的资源使用范围,防止容器过度消耗节点资源。容器启动时 调度器 将根据请求的资源量来决定将容器调度到哪个节点。请求的资源量是容器运行时所需的最小资源,所调度到的节点上确保容器至少可以获得这些资源。限制是容器可以使用的最大资源量。如果容器超出了这个限制,Kubernetes 会采取一定措施,如限制 CPU 或杀死容器(内存溢出时会杀死容器)。

2025-12-01 17:12:06 435

原创 etcd中MVCC 多版本并发控制机制是怎样炼成的

如果没有 MVCC,客户端和 etcd 之间如果发生短暂的网络闪断,客户端重连后,由于不知道断开期间发生了什么,必须重新拉取所有数据(List all),这会造成巨大的性能开销和延迟。但在 etcd MVCC 中,每一次写操作,都不会覆盖旧数据,而是生成一个新的版本。,etcd 所有的更新(包含写、删除)都会生成一个严格递增的全局版本号,用这个新增的版本号 Revision 存储新的数据,老的数据还是保存原地。如上图所示,随着时间增长,我们对 name 值的每次修改,都会严格递增,生成一个新的全局版本号。

2025-12-01 08:57:22 898

原创 K8s 的5 种 Pod 调度策略

调度器通过 Kubernetes 的监测(Watch)机制来发现集群中新创建且尚未被调度到节点上的 Pod。调度的主要任务是将Pod分配到集群中的合适的节点上。调度器根据Pod的需求(如CPU、内存、存储等)和节点的资源状况(如可用CPU、内存、节点标签等)来决定Pod部署在哪个节点上。:简单的节点标签匹配调度。亲和性与反亲和性:更灵活的调度控制,基于节点和 Pod 之间的关系进行调度。nodeName:直接指定节点进行调度。Pod 拓扑分布约束:确保 Pod 在集群中的均衡分布,增强高可用性。

2025-11-24 08:52:16 689

原创 为什么优秀的运维都在学这些?2025必备技能清单

2025年的运维,不再是简单的"重启服务器"和"查看日志",而是需要掌握云原生、编程、监控、自动化等全栈能力的平台工程师。运维行业正在经历深刻变革,传统运维岗位在萎缩,新型运维需求在激增。这是危机,更是机遇。那些提前布局、积极拥抱变化的运维工程师,正在快速成长,薪资翻倍。而那些固守传统、拒绝学习的运维,正在被时代淘汰。• 继续做"重启专家",还是成为"平台工程师"?• 被动等待淘汰,还是主动拥抱变化?• 停留在舒适区,还是持续挑战自己?

2025-11-07 14:16:30 1024

原创 如何写一个自己的Kubernetes Operator

可见,通过kubebuild已经可以快速创建一个operator的模版,但是还是需要根据实际业务以及需求还定义符合需求的CRD,才能真正的提升我们的云原生治理能力。

2025-11-04 15:44:42 965

原创 Linux启动过程详解

上图是Linux启动过程的基本步骤。理解这个过程,有助于系统管理人员排查问题。下面将详细展开讲解。

2025-09-30 17:28:53 484

原创 Linux 操作必备 150 个命令

Linux 命令是对 Linux 系统进行管理的命令。对于 Linux 系统来说,无论是中央处理器、内存、磁盘驱动器、键盘、鼠标,还是用户等都是文件, Linux 系统管理的命令是它正常运行的核心,与之前的 DOS 命令类似。Linux 命令在系统中有两种类型:内置 Shell 命令和 Linux 命令。

2025-09-10 09:07:19 617

原创 运维必备:Kubernetes 核心命令全汇总,覆盖 90% 日常场景

实际使用时,可以通过kubectl --help或kubectl <命令> --help获取更详细的帮助信息。kubectl scale deployment <部署名称> --replicas=<数量>:调整部署的副本数量。kubectl explain <资源类型>:查看资源类型的详细说明,如kubectl explain pods。kubectl create namespace <命名空间名>:创建新的命名空间。kubectl get pods -n <命名空间>:查看指定命名空间的 Pod。

2025-09-09 14:22:25 789

原创 50条MySQL常用命令汇总,入门必学!

常用的MySQL命令。

2025-09-09 08:53:59 609

原创 50 个运维项目经验,每一个都值得写进简历!

在 IT 运维领域,简历上的项目经历往往比证书更有说服力。一个经过精心设计和实施的项目,不仅能体现技术能力,更能展示问题解决能力和业务理解深度。本文精选的 50 个运维项目涵盖基础设施、云原生、自动化、安全等十大领域,每个项目都包含具体场景、技术栈、实施步骤和可量化成果,帮你打造让 HR 眼前一亮的专业简历。

2025-09-08 09:32:36 1388

原创 使用 kubeadm 安装 kubernetes v1.32

本文档讲解如何使用 Kubeadm 工具搭建 Kubernetes 集群,kubeadm 是官方推荐的部署工具,可以快速搭建一个生产级别的集群。

2025-08-27 15:11:09 1022

原创 Linux系统的yum包管理详解

Linux 系统基本上分两大类:RedHat系列:Redhat、Centos、Fedora 等;Debian系列:Debian、Ubuntu 等。目前国产操作系统基本都是基于这两大派系进行二次开发,整体上是换汤不换药,大多数命令是相通的。而yum是一个RedHat系列的包管理器,基于RPM,使用rpm命令处理包。在CentOS 8及更高版本中被dnf(Dandified Yum)取代,dnf提供了一些性能改进和新的特性,使用上和yum基本相同。

2025-08-21 16:49:57 886

原创 Linux常用快捷键汇总,效率飙升!

在日常运维工作中,熟练Linux快捷键是必备技能,可以提高工作效率,下面我将汇总一下常用的快捷键。

2025-08-21 08:47:35 262

原创 vim编辑器的常用操作汇总

vim 是 vi 的扩展,是一个功能丰富的文本编辑器,对于一个运维人员的必备基础技能之一,就是熟练使用 vim/vi 编辑器。在最小化安装环境一般只有 vi,没有 vim,需要手动安装一下。

2025-08-21 08:43:11 297

原创 生产级 Kubernetes 集群部署:Master 节点高可用最佳实践

主机名ip配置4c4g4c4g4c4glb014c4glb024c4gVIP。

2025-08-09 16:59:50 939

原创 高效配置 Kubernetes 资源限制的实战技巧

Kubernetes 允许你为每个容器(Pod 中的每个容器)设置资源的 请求(Requests) 和 限制(Limits),用于指定单个容器的资源使用范围,防止容器过度消耗节点资源。容器启动时 调度器 将根据请求的资源量来决定将容器调度到哪个节点。请求的资源量是容器运行时所需的最小资源,所调度到的节点上确保容器至少可以获得这些资源。Limits:限制是容器可以使用的最大资源量。如果容器超出了这个限制,Kubernetes 会采取一定措施,如限制 CPU 或杀死容器(内存溢出时会杀死容器)。

2025-08-08 18:05:35 673

原创 网络故障场景排查技巧,作为运维一定要遇事不慌!

今天分享一下Linux网络排查的常见故障场景及使用的命令工具。当你的服务器连不上、接口报错、页面加载慢、端口打不开……别慌!看看下面6 大常见网络故障场景,告诉你如何用 Linux 命令!本文只讲服务器网络排查思路,不讲网络设备排查,那是网工的活1 服务器访问不了公网了。

2025-08-08 18:01:13 425

原创 Kubernetes的Pod调度策略详解及实战操作

调度器通过 Kubernetes 的监测(Watch)机制来发现集群中新创建且尚未被调度到节点上的 Pod。调度的主要任务是将Pod分配到集群中的合适的节点上。调度器根据Pod的需求(如CPU、内存、存储等)和节点的资源状况(如可用CPU、内存、节点标签等)来决定Pod部署在哪个节点上。调度已经在前面文章讲解过了,就不详细展开了。下面就详细介绍一下具体的调度策略:简单的节点标签匹配调度。亲和性与反亲和性:更灵活的调度控制,基于节点和 Pod 之间的关系进行调度。nodeName:直接指定节点进行调度。

2025-08-08 17:54:08 908

原创 实战:在已有K8S集群如何新增和删除Node节点

本篇文章将分享一下如何在已有集群添加新节点和删除现有节点。

2025-08-08 17:39:56 536

原创 安装部署K8S集群环境(实测有效版本)

Calico 在每一个计算节点利用 Linux Kernel 实现了一个高效的虚拟路由器( vRouter) 来负责数据转发,而每个 vRouter 通过 BGP 协议负责把自己上运行的 workload 的路由信息向整个 Calico 网络内传播。因此需要安装containerd(在docker的基础下安装),上面安装docker的时候就自动安装了containerd了。在kubernetes中Service有两种代理模型,一种是基于iptables的,一种是基于ipvs,两者对比ipvs的性能要高。

2025-08-08 17:35:21 974

原创 深入解析Go设计模式:工厂模式实战

工厂模式是一种创建型设计模式,通过封装对象创建逻辑,解耦调用者与具体实现类的依赖关系‌。Go工厂模式具体可以细分为简单工厂模式、工厂方法模式和抽象工厂模式。(一)简单工厂模式简单工厂模式是最常用且实现简洁的模式,通过提供统一入口函数来创建不同对象实例。定义一个Decoder接口,并定义Decode。

2025-08-08 15:19:20 365

原创 云计算运维工程师面试题整理

Bind Mount:-v /host/path:/container/path,直接映射宿主机目录。答:Volume:docker volume create my-vol,独立于容器生命周期。原理:轮询(Round-Robin)模式,数据包依次通过每个网卡发送。原理:主备模式,只有一个网卡活跃,其余作为备份(故障时切换)。缺点:需要对端设备支持(如交换机需配置聚合),否则可能乱序。原理:发送流量基于当前负载分配(自适应),接收仅通过主网卡。答:bridge(默认,容器通过虚拟网桥通信)。

2025-08-08 14:45:00 585

原创 领导想要提拔你,从来看的不是努力,而是希望你有这6点!

而小林呢,他不仅工作认真负责,而且善于沟通,乐于助人,是团队中的“开心果”。更重要的是,小林在工作中展现出了解决问题的能力,能够独立思考,提出有效的解决方案。王经理笑呵呵地听完老张的“委屈”,拍了拍他的肩膀说:“小张啊,你工作努力,领导们都看在眼里。领导都喜欢靠谱的人,交代的事情能按时保质保量完成,遇到问题能及时沟通,不推诿、不扯皮。你有没有发现,公司里那些被领导看重、提拔的人,往往不是最努力的,也不是最“卷”的?高情商的人,懂得换位思考,能够体察他人的情绪,更容易获得他人的信任和支持。

2024-07-17 16:11:40 394

原创 在单位,领导不说,但自己得懂的7个道理

朋友打着如意算盘,心想被裁掉也好,正好拿着赔偿金找下家,可那些天天喊着工作没意思的同事,态度突然来了个180度大转变,说自己跟公司已经有感情了,还整天拍领导马屁。看看现在的AI技术,前有强大无比的Chat GPT,后有让人大呼震惊的Sora,如果不具备学习力,恐怕用不了几年,就被层出不穷的新技术、新人踢出局了。把“不是自己”的那部分舍弃掉,你就能看见“自己是谁”了。不是老板或上司苛刻、难伺候,更不是故意跟你过不去,而是你做错事,造成损失,说再多也无济于事,那就把你调走,免得再出什么纰漏和差错。

2024-07-10 08:57:37 2260

原创 真正的向上管理,不是“跪舔”或“拍马屁”,而是做好这5件事!

领导会议上,演讲平平无奇,你非要故作热情,当众拍马屁、吹牛,说领导演讲精彩绝伦,只会让领导更丢脸。聪明人,往往会整理好答案,放上自己的见解,准备好选项,ABCD,让领导去做选择题,而不是问答题。承诺就是预期,领导在你身上能够感受惊喜,发现你是一个潜力无限的人,自然会越发的看重你。主动创造让领导指点你的机会,不仅可以拉近距离,还能借机求教和示好,让领导对你印象更深。多了解领导,和领导沟通,出现在领导的视野里,能够大大增加你上位的概率。另外,你积极求教,频繁露脸,也是在加深印象,表明你积极工作的态度。

2024-06-05 09:16:05 725

原创 35道必懂的 Linux 运维面试题

能当替用户去访问公网,并且能把访问到的数据缓存到服务器本地,等用户下次再访问相同的资源的时候,代理服务器直接从本地回应给用户,当本地没有的时候,我代替你去访问公网,我接收你的请求,我先在我自已的本地缓存找,如果我本地缓存有,我直接从我本地的缓存里回复你;队列的主要目的是提供路由并保证消息的传递;,会先找本机的 host 文件,再找本地设置的 DNS 服务器,如果也没有的话,就去网络中找根服务器,根服务器反馈结果,说只能提供一级域名服务器.cn,就去找一级域名服务器,一级域名服务器说只能提供二级域名服务器.

2024-05-08 09:35:23 1707

原创 Spingboot人工智能工程应用框架,你要干的活全部交给它

尽管人工智能有着悠久的历史,但 Java 在该领域的作用相对较小。这主要是由于历史上依赖于用 C/C++ 等语言开发的高效算法,而 Python 则充当访问这些库的桥梁。大多数 ML/AI 工具都是围绕 Python 生态系统构建的。然而,在 OpenAI 的 ChatGPT 等创新的推动下,生成式 AI 的最新进展已经普及了通过 HTTP 与预训练模型的交互。这消除了对 C/C++/Python 库的大部分依赖,并为使用 Java 等编程语言打开了大门。

2024-04-23 09:02:40 1499 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除