自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(36)
  • 收藏
  • 关注

原创 envoy使用consul做服务发现

上一篇内容,我们详细讨论了怎么使用envoy做负载均衡,并且记录详细的地址,其中还解决了一个问题,那就是怎么让envoy获取真实后端pod ip地址,后面使用headless service,既使用了service的服务发现能力,又不使用service的负载均衡能力如果在某些特殊的场景下完全放弃的k8s service(比如混合云部署机房,两边云都需要有相同的服务,但是服务之间不能跨云访问),怎么赋予envoy服务发现的能力。

2025-12-24 10:20:24 263

原创 追踪链路--使用envoy来记录后端pod真实ip

之前使用了iptables、ipvs,在数据包的必经之路(POSTROUTING)上拦截并且记录日志,本文使用一个比较成熟的组件envoy来记录后端pod的真实ip。

2025-12-22 11:07:36 333 1

原创 追踪链路--使用iptables/ipvs来记录后端pod真实ip

之前使用nginx-ingress-controller来记录后端真实ip,但是有位老哥说了,我没有用nginx-ingress-controller,而是用的原生nginx,这时候又当如何记录后端真实ip的问题呢。

2025-12-17 10:23:21 408 1

原创 链路追踪--使用nginx-ingress-controller记录后端pod真实ip

本文展示如何使用nginx-ingress-controller来记录后端pod真实ip

2025-12-08 11:36:24 746

原创 6年前的项目终于更新了--机房ping监控全国主要城市

当初项目的本意是为了监测中心机房到全国各地(主要是省会与重要城市)的ping速率而创建,目标ip地址是根据某个ip网站爬取,而现在该网站已经下线了,导致目标ip无法获取,再加上所用组件版本已经年久失修,最后是本人懒惰~~,导致项目已经不可用很久了今年勤奋战胜懒惰,又重新占领高地,想着把该项目重修修缮一遍。

2025-11-27 10:40:24 300

原创 opentelemetry全链路初探--日志跳转trace

上一小节描述了metrics、traces,本小节来把log也加进去,并且做一个traces与log的联动当查看日志的时候,可以同时跳转到对应的jaeger,查看分段trace情况。

2025-11-20 11:08:19 352

原创 opentelemetry全链路初探--jaeger架构拆分

jaeger的架构演变在之前的描述中,一直使用jaeger:all-in-one来做数据存储与展示,jaeger:all-in-one就是将collector、query、ui、storage等等功能的大杂烩,在调试与测试环境中,非常方便,但是在生产环境肯定是不能这样用,本节就来 将其拆分成对应的子模块。

2025-11-18 10:43:14 423

原创 opentelemetry全链路初探--python注入

经过上一节,opentelemetry的基本操作都已经融会贯通,但是有位老哥提出疑问?我的代码都已经写完了,为了添加全链路,还需要重构之前的代码吗?那这个代价太大了。那本章就来讨论一下opentelemetry的注入的问题本小节主要关注python注入。

2025-11-12 10:47:52 399

原创 opentelemetry全链路初探--埋点与jaeger

某天一位业务研发老哥跑来咨询研发老哥:我的服务出现了504,但是不太清楚是哪个环节报错,每次请求需要访问4个微服务、2个数据库、1个redis、1个消息队列。。。苦逼运维:停停停,不要再说了,目前不支持链路追踪,只能手动帮你一个服务一个服务的排查了先请老哥大概描述了一下业务逻辑以及访问方式,10分钟过去了。再逐级排查每个服务以及对应访问的资源层,终于在半小时之后完成了故障定位。。。这效率也太低了,于是,关于链路建设项目提上了议程,目标只有一个,快速定位问题,提高稳定性。

2025-11-10 11:11:13 381

原创 彩笔运维勇闯机器学习--孤立森林

孤立森林,一种非常高效快速的异常检测算法。

2025-10-17 10:10:34 770

原创 彩笔运维勇闯机器学习--KNN算法

彩笔运维勇闯机器学习:KNN算法,它也是分类中的一种。

2025-10-13 10:47:49 441 2

原创 彩笔运维勇闯机器学习--GBDT

本文讨论的GBDT算法,也是基于决策树。

2025-09-26 10:06:23 696

原创 彩笔运维勇闯机器学习--lasso回归

彩笔运维勇闯机器学习,今天我们来讨论一下lasso回归,本期又是一起数学推理过程展示。

2025-09-22 10:15:56 641

原创 彩笔运维勇闯机器学习--梯度下降法

本文系统介绍了梯度下降法的数学原理与应用。首先从导数、偏导数等基础概念入手,详细解释了梯度的定义及其在多元函数优化中的意义。然后重点阐述了梯度下降法的核心思想:通过沿负梯度方向迭代调整参数,逐步逼近函数最小值点。文章以一元线性回归为例,展示了梯度下降法的具体计算过程,包括损失函数计算、梯度求解和参数更新步骤。最后指出该方法相比最小二乘法具有更广泛的适用性,可用于各种回归和分类模型。全文通过数学公式和图示相结合的方式,清晰呈现了梯度下降法的理论基础和实现细节。

2025-09-17 11:15:59 619

原创 彩笔运维勇闯机器学习--随机森林

随机森林的出现,是为了解决决策树对训练数据过拟合的问题而出现的。决策树在训练的工程中,可以让每一个叶子节点的不确定性降为0

2025-09-11 14:52:17 303

原创 彩笔运维勇闯机器学习--决策树

决策树是一种常用的机器学习模型,用于分类和回归任务,它通过模拟“树”的结构来对数据进行决策。本节我们详细讨论的是决策树中的分类任务

2025-09-09 11:12:00 1082

原创 彩笔运维勇闯机器学习--逻辑回归

从本节开始,我们的机器学习之旅进入了下一个篇章。之前讨论的是回归算法,回归算法主要用于预测数据。而本节讨论的是分类问题,简而言之就是按照规则将数据分类

2025-09-03 14:15:19 832

原创 彩笔运维勇闯机器学习--拟合

本文通过一个过拟合的例子,使用不同的方法,交叉验证、学习曲线、正则化等方法验证了怎么去评估模型过拟合

2025-09-01 10:14:59 903

原创 彩笔运维勇闯机器学习--多项式回归

在之前的讨论中,讨论的都是线性回归,自变量与结果可以通过一条直线来解释。而今天讨论的问题,自变量与结果可能需要曲线来拟合

2025-08-25 10:23:53 382

原创 彩笔运维勇闯机器学习--最小二乘法的数学推导

今天我们来讨论一下回归算法当中的数学实现

2025-08-22 11:01:34 863

原创 彩笔运维勇闯机器学习--多元线性回归(实战)

书接上文,上一小节简单介绍了多元回归的基本原理、使用方式,本小节来实践:qps与cpu、内存、磁盘io、网络io之间的关系

2025-08-20 14:52:29 1059

原创 彩笔运维勇闯机器学习--多元线性回归

之前讨论了一元线性回归,主要是qps与cpu的关系,但是现实中cpu只是系统指标的一部分,还有内存、io、网络等等,本小节就来讨论一下,通过多个系统参数对于qps的影响

2025-08-18 10:15:11 325

原创 彩笔运维勇闯机器学习--cpu与qps的线性关系

书接上文,上一小节简单介绍了一元回归的基本原理、使用方式,作为运维,实践才是最重要的,那本小节就来实践一下我们之前的话题:探索cpu与qps的关系

2025-08-14 10:40:10 850

原创 彩笔运维勇闯机器学习--一元线性回归

在运维职业生涯中,qps是一个绕不开的话题,leader经常在问,我们的qps是多少,系统能不能抗住啊???老板在问,我们的qps是多少,有没有降本的空间啊???面试的时候,面试官问,你们的qps是多少啊。。。。

2025-08-11 15:11:24 704

原创 重剑无锋--从零开始建设k8s监控之总结(八)

在前文中,prometheus基本的用法都简单的描述一遍,最后本文来讨论一下prometheus高可用的问题

2025-08-01 10:11:14 384

原创 返璞归真--从零开始建设k8s监控之thanos-sidecar(七)

本文详细讨论一下thanos-sidecar

2025-07-30 11:23:33 1141

原创 深入浅出--从零开始建设k8s监控之thanos(六)

本文使用thanos对这些prometheus进行数据汇聚,并且详细讨论一下thanos

2025-07-24 10:46:26 1036

原创 抽丝剥茧--从零开始建设k8s监控之水平拆分(五)

当监控数据越来越多,那prometheus单点的压力就会变大,那本文就来讨论一下如何降低单点prometheus的压力

2025-07-21 10:18:30 874

原创 渐入佳境--从零开始建设k8s监控之pushgateway(四)

prometheus默认是采取pull的方式获取数据,但是有些情况我们依然希望能够主动推数据给prometheus

2025-07-14 17:31:38 478

原创 循序渐进--从零开始建设k8s监控之alertmanager+发送飞书(三)

书接上文,prometheus已经安装好了,监控数据是有了,我们需要对其进行告警,并且可以发送到对应的平台,比如飞书、钉钉等,这里选择用飞书来测试

2025-01-08 10:21:42 608

原创 按部就班--从零开始建设k8s监控(二)

书接上文,prometheus已经安装好了,并且能够对k8s的整体状态进行监控,但是我们还需要更多

2025-01-06 14:44:42 680

原创 循规蹈矩--从零开始建设k8s监控(一)

从零开始建设k8s监控

2024-12-27 14:21:30 1313

原创 明察秋毫--用ss工具统计网络栈内存使用

本文介绍了用ss工具来统计一下当前网络栈的内存使用情况。

2024-12-19 10:45:54 696

原创 不求甚解--详解ansible-playbook中roles的用法(二)

本文将继续介绍ansible-playbook中roles的各种用法

2024-12-13 10:29:36 797

原创 不求甚解--详解ansible-playbook中roles的用法

本文将详细介绍ansible-playbook中roles的各种用法,它允许你将相关的任务、变量、处理器、文件和模板等集合在一起,以便于在不同的项目中复用

2024-12-10 10:21:32 1163

原创 表里不一--限制容器内存4G,free还是32G

明明通过limit给容器内存限制了4G,为什么进容器看到的还是宿主机的内存32G

2024-12-02 10:28:29 524

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除