自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

架构+开发+运维

系统之美、架构之美、IT之美

  • 博客(578)
  • 资源 (10)
  • 收藏
  • 关注

原创 prometheus监控k8s的metric详解-06-etcd、storage、machine、process

如下边第2条数据表示:“etcd租约对象计数”(即,etcd_lease_object_counts) < 10 的 分布的次数。作用:“etcd中租约对象计数”(每次租约对象数量变化都会进行一个计数)这个操作的计数。

2025-12-11 10:04:11 940

原创 GPU节点接入k8s集群的处理

本文提供了一个在Kubernetes集群中集成和管理NVIDIA GPU节点的实用操作指南。主要内容包括:在Ubuntu节点上离线安装NVIDIA容器运行时工具链,并配置Docker和Containerd以支持GPU容器;安装NVIDIA Fabric Manager和DCGM等高级管理插件以启用完整功能;最后,将准备好的GPU节点加入Kubernetes集群,并通过部署官方的Device Plugin DaemonSet,使集群能够发现、调度和使用GPU计算资源。整个流程涵盖了从系统级配置到Kuberne

2025-12-10 14:00:00 500

原创 prometheus监控k8s的metric详解-05(kube apiserver、身份认证、tokens、node_authorizer、pod_security、聚合器)

【代码】prometheus监控k8s的metric详解-05(kube apiserver、身份认证、tokens、聚合器)

2025-12-10 07:00:00 1620

原创 prometheus监控k8s的metric详解-04(kubelet)

注意:它只是“统计每个pod中包含多少个容器的计数”这个的操作的计数,和pod中有多少个pod完全没有关系。既然是各个状态,为什么要标明running?chatgpt说是历史原因,这里我没有继续追问。虽然过滤条件区分pvc,但使用同一个存储设备的pvc值相同,说明它是存储设备的值。直译是:“PLEG重新列出队列”这个操作执行时间的统计行为,该行为执行次数的计数。说明:可以看到,一个pvc在所有节点上都有使用量的记录,且结果一样。值应都是1,应该没有什么意义。比它大1之外,都相等。

2025-12-03 13:00:00 851

原创 【实际操作】pod只允许运行在指定节点上

需求:给k8s的cn-beijing.192.168.12.84这个节点上打标签 project=crust,然后给该节点打污点,使得只有有这个标签的pod才可以运行在这个节点上,而其他容器都不可以运行在这个节点上。

2025-12-03 07:00:00 427

原创 prometheus监控k8s的metric详解-03(coredns)

本文介绍了CoreDNS的关键监控指标,主要包括缓存和请求两大类。缓存指标包含coredns_cache_entries(缓存条目数量,区分成功/拒绝查询)、coredns_cache_hits_total(缓存命中数)、coredns_cache_misses_total(缓存未命中数)和coredns_cache_requests_total(缓存请求总数)。请求指标主要为coredns_dns_requests_total(DNS请求总数),可按协议(TCP/UDP)、查询类型(A/AAAA/SRV)

2025-09-05 12:00:00 943

原创 prometheus监控k8s的metric详解-02-container部分

本文介绍了Kubernetes中监控CPU使用情况的几个关键指标:container_cpu_load_average_10s(10秒平均CPU负载)、container_cpu_usage_seconds_total(CPU总使用时间)、container_cpu_system_seconds_total(系统态CPU时间)和container_cpu_user_seconds_total(用户态CPU时间)。重点解析了CFS调度相关指标container_cpu_cfs_periods_total(CP

2025-09-05 07:30:00 1171

原创 prometheus监控k8s的metric详解-01-apiserver部分-05-其他

本文介绍了Kubernetes API服务器相关的缓存和客户端证书监控指标。在缓存部分,重点关注apiserver_cache_list_total指标,它展示了不同资源类型在缓存中的对象数量,如Pod(14个)、CustomResourceDefinition(10个)等。客户端证书部分,apiserver_client_certificate_expiration_seconds_count用于监控客户端证书过期检查频率,示例显示某节点10分钟内平均每秒发生0.6次检查;而apiserver_clien

2025-07-24 14:40:13 959

原创 ubuntu 22.04安装k8s高可用集群

本文介绍了在Ubuntu 22.04系统上为Kubernetes集群准备环境的详细步骤。主要内容包括:1) 服务器规划与系统信息配置;2) 关键环境准备操作:关闭交换分区和防火墙,配置主机名与hosts文件,设置网络路由和加载内核模块;3) 配置apt软件源并安装必要的依赖工具。文档提供了完整的命令操作流程,适用于搭建高可用Kubernetes集群前的系统环境准备工作,特别针对三节点master集群架构进行了详细说明。

2025-05-29 10:23:15 1734

原创 prometheus监控k8s的metric详解-01-apiserver部分-04-storage/events

prometheus监控k8s的metric详解-01-apiserver部分-04-storage

2025-05-07 13:00:00 1241

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-03-Lambda 架构

《系统架构设计师教程(第2版)》笔记,第19章-大数据架构设计理论与实践-03-Lambda 架构

2025-05-07 07:00:00 1002

原创 k8s集群GPU监控项说明

PCIe (Peripheral Component Interconnect Express)是一种高速串行计算机扩展总线标准,用于连接计算机主板与各种硬件设备(如显卡、固态硬盘、网卡等)NVLink 是 NVIDIA 开发的一种高速互联技术,用于在多个 GPU 之间或 GPU 与 CPU 之间传输数据。作用:表示 GPU 显存的时钟频率,单位MHz。

2025-04-21 14:40:13 538

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-02-大数据处理系统架构分析

《系统架构设计师教程(第2版)》笔记,第19章-大数据架构设计理论与实践-02-大数据处理系统架构分析

2025-04-10 12:00:00 709

原创 prometheus监控k8s的metric详解-01-apiserver部分-03-request

prometheus监控k8s的metric详解-01-apiserver部分-03-request

2025-04-10 08:00:00 1044

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-01-传统数据处理系统存在的问题

《系统架构设计师教程(第2版)》笔记,第19章-大数据架构设计理论与实践-01-传统数据处理系统存在的问题

2025-04-08 12:00:00 550

原创 prometheus监控k8s的metric详解-01-apiserver部分-02-apiserver flowcontrol(API 流量控制器)

prometheus监控k8s的metric详解-01-apiserver部分-02-apiserver flowcontrol(API 流量控制器)

2025-04-08 07:30:00 1188

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-07-系统架构的脆弱性分析

《系统架构设计师教程(第2版)》笔记,第18章-安全架构设计理论与实践-07-系统架构的脆弱性分析

2025-03-18 07:30:00 1190

原创 系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-06-数据库的完整性设计

数据库完整性:指数据库中数据的正确性和相容性由完整性约束来保证完整性约束可通过DBMS(Database Management System)来实现,完整性约束作为模式的一部分存入数据库中。

2025-02-12 12:30:00 617

原创 deepseek本地使用(内网搭建ollama+deepseek+open-webui)

如果服务器没有外网,可以把它关掉,否则每次访问等超时会超级慢长。不一定在GPU服务器上,我是在另一台服务器上启动的。需要安装完NVIDIA驱动。

2025-02-12 07:00:00 1675

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-05-网络安全体系架构设计

《系统架构设计师教程(第2版)》笔记。第18章-安全架构设计理论与实践-05-网络安全体系架构设计

2025-01-17 07:00:00 2251

原创 prometheus监控k8s的metric详解-01-apiserver部分-01-准入控制器、审计、委托

prometheus监控k8s的metric详解-01

2025-01-17 01:30:00 537

原创 docker-compose启动redis主从

docker-compose启动redis主从

2025-01-14 12:30:00 858

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-04-信息安全整体架构设计

《系统架构设计师教程(第2版)》笔记,第18章-安全架构设计理论与实践-04-信息安全整体架构设计

2025-01-14 07:00:00 992

原创 docker-compose搭建sfpt服务器

docker-compose搭建sfpt服务器

2024-12-26 20:28:45 710

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-03-系统安全体系架构规划框架

《系统架构设计师教程(第2版)》笔记,第18章-安全架构设计理论与实践-03-系统安全体系架构规划框架

2024-11-19 12:30:00 1476

原创 k8s集群加入node节点为ubuntu 22.04

k8s集群加入node节点为ubuntu 22.04

2024-11-19 07:30:00 1272

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-02-安全模型

《系统架构设计师教程(第2版)》笔记,第18章-安全架构设计理论与实践-02-安全模型

2024-10-11 13:00:00 1397

原创 《系统架构设计师教程(第2版)》第18章-安全架构设计理论与实践-01-安全架构概述

《系统架构设计师教程(第2版)》笔记,第18章-安全架构设计理论与实践-01-安全架构概述

2024-10-11 07:00:00 849

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-06-网络构建和设计方法

《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-06-网络构建和设计方法

2024-10-09 07:00:00 1078

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-07-通信网络构建案例分析

《系统架构设计师教程(第2版)》笔记,第17章-通信系统架构设计理论与实践-07-通信网络构建案例分析

2024-10-09 01:30:00 1301

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-05-网络构建关键技术

《系统架构设计师教程(第2版)》笔记,第17章-通信系统架构设计理论与实践-05-网络构建关键技术

2024-09-23 13:30:00 979

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-04-其他网络架构(存储网络架构、软件定义网络架构)

《系统架构设计师教程(第2版)》第17章 笔记,通信系统架构设计理论与实践-04-其他网络架构(存储网络架构、软件定义网络架构)

2024-09-23 07:30:00 1208

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-03-移动通信网网络架构

《系统架构设计师教程(第2版)》笔记,第17章-通信系统架构设计理论与实践-03-移动通信网网络架构

2024-09-03 13:00:00 1215

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-02-广域网网络架构

《系统架构设计师教程(第2版)》笔记,第17章-通信系统架构设计理论与实践-02-广域网网络架构

2024-09-03 07:30:00 1658

原创 《系统架构设计师教程(第2版)》第17章-通信系统架构设计理论与实践-01-局域网网络架构

《系统架构设计师教程(第2版)》笔记,第17章-通信系统架构设计理论与实践-01-局域网网络架构

2024-08-28 12:30:00 1012

原创 《系统架构设计师教程(第2版)》第15章-面向服务架构设计理论与实践-06-SOA架构注意的问题和具体实施

《系统架构设计师教程(第2版)》笔记,第15章-面向服务架构设计理论与实践-06-SOA架构注意的问题和具体实施

2024-08-28 07:00:00 911

原创 《系统架构设计师教程(第2版)》第15章-面向服务架构设计理论与实践-04-SOA设计

《系统架构设计师教程(第2版)》笔记,第15章-面向服务架构设计理论与实践-04-SOA设计

2024-08-22 12:30:00 1822

原创 《系统架构设计师教程(第2版)》第15章-面向服务架构设计理论与实践-03-SOA主要协议和规范

《系统架构设计师教程(第2版)》笔记,第15章-面向服务架构设计理论与实践-03-SOA主要协议和规范

2024-08-22 07:30:00 864

原创 《系统架构设计师教程(第2版)》第15章-面向服务架构设计理论与实践-02-SOA的参考架构

《系统架构设计师教程(第2版)》笔记,第15章-面向服务架构设计理论与实践-02-SOA的参考架构

2024-08-20 07:30:00 856

原创 《系统架构设计师教程(第2版)》第15章-面向服务架构(SOA)设计理论与实践-01-概述

《系统架构设计师教程(第2版)》笔记,第15章-面向服务架构(SOA)设计理论与实践-01-概述

2024-08-19 08:00:00 1219

openssh-9.3p2升级包(openssh、zlib、openssl)

包含openssh升级到openssh-9.3p2的所有包,其内容如下: - openssh-9.3p2.tar.gz - openssl-1.0.2o.tar.gz - zlib-1.2.11.tar.gz 解决漏洞: - OpenSSH 安全漏洞(CVE-2023-38408) - OpenSSH远程代码执行漏洞(CVE-2024-6387)1 - OpenSSH 安全漏洞(CVE-2023-51767) - OpenSSH 安全漏洞(CVE-2023-51385) - OpenSSH 安全漏洞(CVE-2023-48795) - OpenSSH 安全漏洞(CVE-2023-51384)

2024-07-29

Vue 2.0 路由示例(赤壁之战指挥官查询)

Vue 2.0 路由示例 # 启动方法: - 解压缩文件 - 进入目录 - 执行如下命令 ```shell cnpm install cnpm run dev ``` # 访问: http://127.0.0.1:8000

2022-05-30

nacos.tar.gz

docker-compose 一键启动 nacos服务

2021-08-18

helm.tar.gz

helm v3.5.4

2021-08-13

升级openssh包.zip

升级openssh7.9 资源包

2021-11-03

ttpy-1-6-3.tar.gz

ttpy 1.6.3

2021-08-25

docker-compose_install.tar.gz

docker docker-compose 离线一键部署包(适用 centos 7 )

2021-08-12

chronograf.tar.gz

chart for chronograf

2021-08-17

kapacitor.tar.gz

chart for kapacitor

2021-08-17

pgrouting.sql

pgrouting的初始化sql脚本

2021-08-13

kubeadm_1_15_11.tar.gz

kubeadm_1.15.11 百年证书。本质是一个我自己修改编译的kubeadm二进制文件。 兼容:经测试1.15版本均可用 使用操作流程: 下载----解压缩-----替换原有kubeadm文件----命令行执行更新证书

2021-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除