自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 10期实战直播|腾讯云可观测平台全面升级,场景实践一次讲透

25年可观测平台随着两大核心变革一体化观测+AI工作台的推出,持续丰富产品功能、优化产品体验,在数据采集上,支持了对更多云产品和业务指标的一键集成,在 AI智能化方面,不断优化SRE数字分身能力,支持智能告警分析及治理,同时也实时关注大模型应用的可观测性,上线 LLM应用的全链路观测能力,兼容SSE协议,为 AI 应用提供全方位的体验保障…我们将通过一系列的产品介绍、场景应用、以及实操演示直播带您使用全面升级的腾讯云可观测平台,搭建更完整的业务可观测性,更高效定位问题,保障业务稳定。

2025-11-04 16:25:09 342

原创 安全漏洞难溯源?腾讯云应用性能监控一键开启轻量化、全场景安全监测

腾讯云可观测平台 AI 工作台,采用主动式随机探索技术,提前发现隐藏风险,故障时更能聚焦目标,快速解决问题。

2025-07-25 16:48:07 672

原创 从原理到实践:万字详解 Kubernetes 核心组件与指标监控

文章主要探讨了 Kubernetes 监控的重要性、关键组件及其核心指标,并详细分析了 Kubernetes 指标是如何暴露和采集的。

2025-03-19 15:55:10 1156

原创 DeepSeek 大热背后,不容忽视的 AI 应用体验挑战

在 AI 服务日益成为业务核心的今天,传统监控体系在应对 SSE 这类流式传输协议时暴露出明显短板——当数以万计的异步消息在客户端与服务端间持续流动时,如何捕捉每个微小的异常波动?如何在复杂的对话场景中保障用户体验?:凌晨三点,研发负责人小李盯着屏幕上的对话框,焦急地点着“重新生成”,心里反复祈祷能够尽快复现问题场景。数周加班加点部署的在线 DeepSeek-R1 满血版刚刚上线,原本信心满满的团队却被用户反馈炸开了锅——AI 助手在关键时刻“卡住”,长达 30 秒没有任何响应。

2025-02-28 14:43:48 1171

原创 客户案例|某车企建设统一监控平台实践

文章主要介绍腾讯云 Prometheus 在监控出行行业的突出优势与解决方案,为客户运维团队降低了很多成本。

2025-01-23 10:23:28 1028

原创 Kubernetes 排障实战:用 Prometheus 提升集群可用性和排障效率

一份超详细的用 Prometheus 监控 Kubernetes 平台指南

2024-12-27 15:47:29 1004

原创 揭秘可观测利器:腾讯云 APM 深度融合 OpenTelemetry 和 Prometheus,助力高效指标采集与处理

前言腾讯云应用性能监控(APM)作为腾讯云可观测平台(TCOP)旗下专注于应用性能管理的产品,基于链路、指标、日志等可观测数据,提供一站式应用性能管理能力,能够有效加速故障排查,定位架构瓶颈,为业务的健康和稳定保驾护航。Prometheus 是一个功能强大、灵活且扩展性强的开源可观测平台,提供了多维数据模型、丰富的采集能力,以及强大的查询语言。作为 CNCF(Cloud Native Computing Foundation)旗下最重要的开源项目之一,Prometheus 在云原生时代被广泛使用

2024-11-26 16:11:47 1691

原创 「可观测」如何为「新能源车企」缓解运维焦虑?

腾讯云可观测平台为车企运维提效的实践案例分享

2024-11-12 15:27:30 990 1

原创 一文详解腾讯云可观测平台 APM 采样方案

但在链路的其它环节,调用的响应时间都是非常快的,其中有一部分的 Span 信息会在8秒的慢调用完成前就上报到 APM 服务端,当 APM 服务端收到这部分数据的时候,并不能立即做出决策,而是需要将数据整体缓存一段时间,直到这条链路的所有参与者都成功上报了 Span 信息,才能进行判断。回顾采样的基本原理,头部采样在链路入口做出采样决策的时候,并不需要考虑该链路后续可能发生的情况,因此可以非常简单的引入一套采样算法,任何满足统计学要求的算法都是可行的,比如基于百分比的随机算法,或者参考请求特征的哈希算法。

2024-09-20 16:31:01 1716

原创 Prometheus 标签全揭秘:从数据源到仪表盘

一文搞懂腾讯云 Prometheus 标签

2024-08-13 14:39:39 1761

原创 0元体验|使用 Prometheus 监控 Kubernetes 的最佳实践

Prometheus 监控 Kubernetes 的优势在哪里?

2024-06-20 15:48:33 1189

原创 重磅上线:腾讯云应用性能监控 APM 实现多语言应用秒级接入

腾讯云可观测 APM 全新发布 Operator 方案,实现多语言应用一键接入!

2024-05-31 09:38:32 1440

原创 Prometheus 指标值不准:是 feature,还是 bug?

Prometheus 为何会出现指标值不准的 “怪现象”?

2024-05-09 17:46:03 1302 1

原创 APM 应用诊断系列(二):定位资源池问题

基于 APM 如何快速定位资源池问题

2024-04-19 11:45:34 1016

原创 使用云压测回放 GoReplay 录制的请求

如何突破 GoReplay 单机资源瓶颈,极限模拟真实用户流量

2024-03-29 11:03:41 1246 1

原创 干货满满丨万字超全 ElasticSearch 监控指南

推荐收藏,带你全面了解 ES 监控

2024-03-19 12:02:03 1612 1

原创 APM 应用诊断系列(一):持续线程剖析

解决偶发慢调用问题的一种利器

2024-03-05 10:11:12 1212 1

原创 性能瓶颈定位最佳实践:使用Prometheus 观测性能压测指标

压测后如何准确评估系统?

2024-02-01 10:36:48 2264 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除