自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 `vmstat` 工具及性能压测分析

vmstat通过vmstatCPU 饱和需减少进程争用或横向扩展。内存压力需合理分配资源并监控缓存效率。I/O 瓶颈需升级硬件或调整调度策略。系统开销需优化中断和上下文切换频率。

2025-04-07 00:50:13 455

原创 使用 mpstat 与 stress-ng 进行 CPU 性能监控

mpstat 是 Linux 下的一个性能监控工具,可用于显示各个 CPU(或所有 CPU 汇总)的各项利用率指标。-P ALL:显示所有 CPU 的详细信息后面的数字(例如5)表示采样间隔,即每 5 秒采集一次数据。

2025-03-30 18:23:00 958

原创 stress-ng命令详解

核心功能多维度负载模拟:支持超过 80 种负载模式,包括浮点运算、内存分配、文件操作、网络压力等。精准资源控制:可指定负载施加的 CPU 核心、内存大小、I/O 强度等。跨平台兼容:支持 x86、ARM 等架构,适用于嵌入式系统到服务器级场景。安装方法手动编译从GitHub 仓库获取源码编译,支持自定义功能。系统稳定性测试:模拟极端负载,验证服务器长期运行的可靠性。资源分配验证:测试容器(如 Docker/K8s)的 CPU、内存配额是否生效。硬件故障排查。

2025-03-23 19:00:00 548

原创 使用 NGINX Ingress 进行 Canary 发布

Canary 发布是一种渐进式部署方式,其核心思想是将新版本的服务首先部署到生产环境中的一小部分用户(称为“金丝雀”),通过监控其性能和用户反馈来验证稳定性。如果一切正常,再逐步将流量切换到新版本;如果发现问题,则可以快速回滚。这种策略在减少部署风险的同时,保证了用户体验。通过 NGINX Ingress Controller,我们可以轻松实现 Canary 发布,支持基于 Cookie、权重和请求头等多种流量分配策略。

2025-03-16 17:21:21 924

原创 优化 NFS 挂载参数以提升可靠性与容错性

通过优化 NFS 挂载参数,我们可以大幅提高挂载的可靠性和容错性。rw:确保文件系统可读写,依赖服务器端配置。bg:挂载失败时后台重试,避免系统阻塞。timeo=50:控制超时时间,适用于网络不稳定的环境。retrans=2:设定重试次数,增加挂载成功的几率。这些参数的合理配置能有效提升 NFS 挂载操作的成功率,减少挂载失败对业务的影响。希望本文能帮助你优化 NFS 挂载设置,提升整体系统的可靠性。如果你遇到挂载问题,可以参考这些技巧进行调试和优化。

2025-03-10 09:16:26 840

原创 使用 `resolvectl` 配置 DNS 的技术文档

resolvectl是服务的命令行管理工具,用于配置和管理 Linux 系统的 DNS 解析。通过resolvectl,用户可以为特定网络接口设置静态 DNS 服务器、查看 DNS 状态或清除缓存等。本文档将重点介绍如何使用resolvectl为指定网络接口(如enp0s3)配置静态 DNS 服务器地址(如8.8.8.8。

2025-03-02 17:49:30 303

原创 如何设置基于 prometheus-operator 的监控告警

通过 prometheus-operator,我们可以在 Kubernetes 集群中轻松设置监控和告警。1. 使用 PromQL 查询语言来定义监控指标。2. 使用 PrometheusRule 定义告警规则,基于 PromQL 查询触发告警。3. 通过 Alertmanager 配置告警通知,将告警信息发送到不同的通知渠道。这种方式不仅提高了监控的自动化程度,还使得在 Kubernetes 环境下的服务监控和告警变得更加灵活和易于扩展。

2025-02-23 19:00:48 554

原创 如何通过 prometheus-operator 实现服务发现

完整步骤回顾:1. 部署应用:将自定义的 prometheus-go 应用部署到 Kubernetes 集群中。2. 创建 ServiceMonitor:使用 ServiceMonitor 配置,告诉 Prometheus 自动发现并抓取服务的指标。通过这些步骤,你就能在 Kubernetes 集群中轻松实现 Prometheus 服务发现,并能够监控多个容器化的服务。

2025-02-16 19:36:58 529

原创 编写一个自定义 Exporter

本文将使用Go 语言和Gin 框架,结合Prometheus实现了一个简单的自定义监控服务器。请求计数器:记录每种状态(success或error)的请求次数。活跃请求数:记录当前正在处理的请求数量。请求处理时长:记录请求的处理时长(以秒为单位)。var (// 请求计数器},// 当前活跃请求数},// 请求处理时长(秒)},:计数器(Counter)类型,用于记录不同请求状态(success或error)的次数。:仪表(Gauge)类型,用于记录当前活跃请求的数量。

2025-02-08 22:55:16 523

原创 Prometheus 中的 Exporter

Exporter 是一段软件,它从应用程序或系统中收集度量数据,并将这些数据暴露为 Prometheus 可以抓取的格式。Prometheus 使用 拉取模型(Pull model)来收集数据,这意味着 Prometheus 会定期查询 Exporter 的 HTTP 端点来获取度量数据。Exporter 的主要任务是将特定应用程序或系统的度量数据转换为 Prometheus 可理解的格式,通常是时间序列数据,以键值对的形式存储。这些数据将被 Prometheus 收集、存储,并供后续查询和分析使用。

2025-02-01 21:27:44 1373

原创 安装 Prometheus、Grafana 和 Alertmanager

这篇文章将介绍 Prometheus、Grafana 和 Alertmanager 的安装与部署。前文已介绍了 Prometheus 和 Alertmanager,而 Grafana 是一个开源的数据可视化与分析平台,广泛用于展示时序数据,通常与 Prometheus 配合使用,作为其前端仪表盘工具。

2025-01-26 18:00:00 712

原创 Prometheus架构总览

PrometheusServer是Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。

2025-01-19 20:14:34 684

原创 k8s物料清单工具——KubeClarity

KubeClarity是一个用于检测和管理容器镜像和文件系统的软件清单(SBOM)和漏洞的工具。它扫描运行时的K8s集群和CI/CD流水线,以增强软件供应链安全性。

2025-01-12 17:46:16 265

原创 Docker Compose 启动 Harbor 并指定网络

Harbor 是一个开源的企业级 Docker 镜像仓库,提供镜像存储、访问控制、安全扫描等功能。使用 Docker Compose 启动 Harbor 时,您可以指定一个自定义网络,以便管理容器之间的网络通信。在本示例中,我们将创建一个名为。

2025-01-06 10:25:23 519

原创 Cilium CLI 安装与配置

Cilium 是一个开源的容器网络和安全项目,基于 eBPF(扩展的 Berkeley Packet Filter)技术,旨在为现代云原生环境提供高效且可扩展的网络安全解决方案。

2024-12-29 18:33:28 450

原创 elasticache备份

创建一个名为my_backup的快照存储库,指定存储路径为,并启用数据压缩。typefslocationcompress使用my_backup存储库备份所有索引并等待备份完成。indices检查已创建快照的状态,确认备份是否成功。从创建的快照恢复所有索引以及全局状态。indices在恢复快照时可能会包权限不足的问题,可能是因为 searchguard 这个索引的原因,如果遇到这个问题可以考虑一个一个索引的恢复。

2024-12-22 16:19:57 966

原创 中断无法显示中文——Xshell

完成以上步骤后,您的终端将使用 GBK 字符编码,这有助于正确显示中文字符,避免出现乱码问题。为确保编码更改生效,建议关闭当前会话并重新连接虚拟机。为确保编码更改生效,建议关闭当前会话并重新连接虚拟机。在属性窗口中,找到并点击左侧菜单中的“终端”选项。在会话列表中,找到您需要更改编码设置的虚拟机。点击“确定”或“应用”按钮,保存您的更改。在“终端”设置界面中,找到“编码”选项。启动您使用的终端软件。从编码下拉菜单中选择。

2024-12-15 18:55:22 497

原创 Iac工具——Crossplane

它允许开发人员和运维团队通过声明式的方式来管理云资源,并提供跨多个云平台(如 AWS、Azure、Google Cloud 等)的统一 API。Crossplane 通过提供可扩展的 Provider 和资源控制(如数据库、网络和存储等)来简化多云环境的管理。以下是一个示例 YAML 文件,用于创建一个 Kubernetes 对象(如 Namespace)。使用以下命令创建一个 Kubernetes 配置的 Secret,并将其应用到。以下是一个示例 YAML 配置文件,用于创建一个名为。

2024-12-08 19:52:39 293

原创 arm 架构 Centos 如何配置 yum 源

目前很多国产服务器都是 arm 的 CPU,本文将介绍如何配置 arm 版本的 CentOS 的 yum 镜像。

2024-12-01 21:51:30 646

原创 基于 Nginx Ingress Controller 的四层(TCP)转发配置

本指南将展示如何通过配置ConfigMap来实现 Nginx Ingress Controller 的四层转发(TCP),并通过配置测试应用程序验证配置的有效性。本文中使用的 Kubernetes 组件包括ConfigMapServiceDeployment以及 LoadBalancer 类型的 Service。还将演示如何热加载修改ConfigMap,以使更改能够即时生效。Nginx-Ingress-Controller 的安装文档可以参考此。

2024-11-24 18:24:15 1698

原创 Mac 电池没电关机导致时间不同步

【代码】Mac 电池没电关机导致时间不同步。

2024-11-17 16:34:32 834

原创 使用 nsenter 进入 Docker 容器的操作

nsenter是 Linux 下的一个命令行工具,用于进入指定的命名空间中执行操作。Docker 容器本质上是通过 Linux 的命名空间(Namespace)实现隔离的。因此,使用nsenter我们可以直接进入容器的命名空间,而无需依赖 Docker 自带的命令。这种方式特别适用于调试复杂问题或者在 Docker 服务不可用的情况下操作容器。

2024-11-10 16:25:47 1175

原创 KubeVirt 安装和配置 Windows虚拟机

本文将将介绍如何安装 KubeVirt 和使用 KubeVirt 配置 Windows 虚拟机。

2024-11-03 20:18:33 1161

原创 openebs-zfs

以上是使用 OpenEBS 的 ZFS 本地存储模式的操作记录。包括安装、PVC 的创建、快照的管理、克隆卷的操作、Pod 使用 PVC 以及 ZV 的查看等步骤。通过这些步骤,可以有效地管理 Kubernetes 中的存储资源。

2024-10-27 17:12:41 960

原创 zfs文件系统

ZFS(Zettabyte File System)是一种先进的文件系统和逻辑卷管理器,最初由 Sun Microsystems 开发。ZFS 具有数据完整性验证、快照、复制、压缩和高扩展性等特性,非常适合用于存储管理和数据保护。它支持高效的存储池管理,允许多个设备组成一个存储池,并提供强大的数据恢复和快照功能。本文将首先介绍 ZFS 的数据分布模式及其区别,重点讨论镜像模式和条带模式。接着说明它作为文件系统和卷管理器的两种主要使用方式,最后通过具体的操作步骤演示如何创建和管理这些存储池和卷。

2024-10-21 00:59:43 936

原创 Kubernetes NGINX Ingress Controller

NGINX Ingress Controller 是用于在 Kubernetes 集群中管理 HTTP 和 HTTPS 流量的控制器。它允许用户通过 Ingress 资源配置入口点,从而轻松将外部请求引导到集群内的服务。负载均衡:将流量分配到多个服务副本上,以提高可用性和可靠性。SSL/TLS 终止:可以在入口点终止 SSL/TLS,加密和解密请求流量,以减少应用服务的负担。基于路径和域名的路由:支持基于请求的 URL 路径或主机名,将请求转发到不同的服务。跨域资源共享 (CORS)

2024-10-14 09:39:14 483

原创 内存监控的深入探究

在日常工作中,对于内存的监控也是不可缺失的一环,本节将从内存的监控原理和计算过程,两个方面介绍如何实现对于内存使用率的监控。

2024-10-06 22:03:06 529

原创 signoz——基于Opentelemetry的监控平台

如下图所示,SigNoz 是一个基于 Opentelemetry 构建的可观测性平台,同时具有 Metrics、Logs 和 traces 的功能,下面是整体的架构图:在安装之前,需要先准备一个 k8s 集群执行以下命令安装 SigNoz :安装完成之后,执行命令 ,显示以下输出则表示安装成功:配置在浏览器打开 SigNoz,同样的在 PowerShell 中执行以下命令获取 SigNoz 的访问地址:作为一个监控平台,我们最关心的一个就是如何去配置一个面板,点击此链接即可跳转到 SigNoz 官方

2024-09-29 17:50:35 586

原创 calico寻找网卡的方法

在 kubernetes 上部署 calico 后可能出现找不到网卡情况,本文将介绍 calico 寻找网卡的集中方式。calico 的网卡寻找方式都在 kube-system 的 confimap 中的 calico-config 进行配置,可以执行来获得此文件。文件中控制网卡的字段主要为:ip_autodetection_method。

2024-09-22 19:53:31 537

原创 CPU监控的深入探究

在日常工作中,对于 CPU 的监控也是不可缺失的一环,本节将从 CPU 的监控状态和计算服务器当前 CPU 的使用率,两个方面介绍如何实现对于 CPU 使用率的监控。

2024-09-15 17:41:38 1149

原创 ubuntu安装chrony时间管理软件

chrony 是一个开源软件包,用于在 Linux 和其他类 Unix 系统上实现时间同步。本文将介绍如何再 ubuntu 使用 chrony 搭建一个 NTP 服务器。

2024-09-08 19:57:56 1120

原创 制作ISO镜像,并写入DVD

在 WINDOWS 上制作光盘默认格式都是 UDF,UDF 的格式在 linux 上兼容性不太好,测试的结果过只能读取前 800M 的数据,建议使用 imgBurn 进行制作 iso 然后将 iso 写入光盘中。将 iso 写入 DVD。

2024-09-01 21:15:42 379

原创 持续调优的工具-Pyroscope

Pyroscope 是一个持续调优的工具,可以检查程序代码在运行时,检查 CPU 的使用率和内存内存的使用率,本文将介绍如何搭建和使用。

2024-08-25 22:26:11 323

原创 flamingo的安装

概述flamingo 是 flux 团队在 ArgoCD 的基础上增添了对 Terraform 支持,其余均和 ArgoCD 一样。安装flamingo 安装需要 Kubernetes 版本 >= 1.22.0flux 命令安装安装 flux 命令,执行以下命令:choco install fluxflux 组件安装安装 flux 组件,执行以下命令:flux install在国内可能无法执行使用 flux install 命令进行安装,按照以下步骤执行:创建一个 flux

2024-08-18 21:29:09 251 1

原创 如何在一台服务器安装两个 Harbor

一台服务器安装两个 Harbor,这样的操作在生产中是不推荐的,但是由于各种各样的原因,可能会发生这情况,本文将介绍如何在一台服务器上搭建两个 Harbor。

2024-08-11 19:12:50 426

原创 karmada 快速入门

Karmada 在 k8s 集群之上抽象了一个 k8s 集群,被抽象出来的集群中的节点就是部署在各个地方的 k8s 集群,通过创建调度策略,来指定每个资源运行在哪个 k8s 集群中。

2024-08-04 21:21:39 794 1

原创 Docker 的知识总结

Docker 通过其强大的虚拟化技术和丰富的生态系统,极大地简化了应用的开发、测试和部署流程,使得软件工程师能够更加高效地进行工作。了解 Docker 的基础知识和常用操作,能够帮助我们更好地利用这一工具,提高工作效率。

2024-07-28 15:33:13 383

原创 elastisearch安装和运维常用API

elasticsearch 是一个文档型数据库,在 k8s 运维中,通常和 kibana 和 fluentd 结合作为 k8s 上的日志数据库,本文将介绍 elasticsearch 的搭建和一些运维时常用的 api。

2024-07-21 16:16:51 373

原创 sysbench测试工具

sysbench 是一个多线程基准测试工具,旨在评估系统的性能。它特别适用于数据库服务器,但也可以用于其他类型的系统。Sysbench 提供了一组全面的测试,可以测量 CPU、内存、磁盘 I/O 和数据库的性能。本文将介绍,sysbench 如何进行下载安装,并何如进行上述功能的测试。

2024-07-14 16:24:07 1094

原创 使用 Pulumi 创建 pve 平台的虚拟机

基础设施即代码 (Infrastructure as Code)简称 IaC,主要是通过代码的方式管理云平台资源,比如 AWS 的 vpc ec2 ecs eks elb 等等。Pulumi 属于第二种,使用编程语言进行编写,本文将介绍如何使用 pulumi 创建 pve 平台的虚拟机。

2024-07-07 16:50:38 648

深度学习 KAN 最新发布论文

深度学习 KAN 最新发布论文

2024-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除