redis的cpu过高

原创已于 2025-07-11 09:51:04 修改 · 4.9k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#数据库

于 2022-04-26 18:04:44 首次发布

redis学习专栏收录该内容

15 篇文章

订阅专栏

一、背景

因为这段时间出现了一些redis cpu飙升的问题，所以总结了一些排查和解决的办法

二、产生原因和解决思路

主要产生原因有以下几点:

1.大量慢日志：

排查： 可根据以下三篇文档排查
慢日志相关：
https://blog.youkuaiyun.com/line_on_database/article/details/124098647
python收集慢日志：
https://blog.youkuaiyun.com/line_on_database/article/details/124118407
大key分析：
https://blog.youkuaiyun.com/line_on_database/article/details/115702487

解决思路：

业务逻辑上更改慢查询语句
因为大key产生的慢查询则拆分大key
如果是cluster可以选择增加分片

2.高频的排序集相关的操作

排查方法：

2.1 查看monitor监控，观测哪些命令最多，观测cpu飙升阶段哪些命令的数量飙升

 redis-cli -h monitor > a.txt

ps: 如果monitor被重命名了可以采用如下方式获取

timeout 50 nc 127.0.0.1 6379 > redis.monitor
auth ****
MONITOR*** # monitor重命名的命令

2.2 观测info中的命令数量，是否有哪些命令量飙升

info commandstats
# 官网地址：https://redis.io/commands/info/
# calls: 到达命令执行（未拒绝）的调用次数
# usec: 这些命令消耗的总 CPU 时间
# usec_per_call:每次命令执行消耗的平均 CPU

解决： 从程序侧观察是否无用的命令太多，基于排序集的命令比较耗cpu,如果是针对多个key的高频排序集访问，只能从程序处降低该种命令的频率，逻辑优化，增加分片可能效果不大

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

与数据交流的路上

关注关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Redis高频面试基本问题与知识点整理

曾经“等你生日那天”都遥远得像未来，如今却可欢愉的挥手说“下个十年见”

04-07

173万+

对Redis一些重点内容进行整理总结用于查缺补漏，应对各大互联网大厂面试方向题库

redis cpu占用过高排查

最新发布

云深海阔专栏

10-11

862

场景是否建议升级“流量”监控显示 output 带宽接近上限✅ 强烈建议升级CPU 单核打满（>90%）且 Redis 5.0⚠️ 升级流量帮助有限，建议升级版本Pub/Sub 消息非常多🚫 不建议仅靠流量解决，应优化架构内存充裕但响应变慢✅ 升级 CPU/流量均有助益。

redis服务器cpu100%的原因和解决方案

weixin_44753686的博客

03-15

1万+

上一篇讲述了由于redis服务器cpu100%导致网站502的问题，今天延续上一篇的内容，说明一下原因和分析过程。首先引起cpu100%可能的几大原因： 1.redis连接数过高 2.数据持久化导致的阻塞 3.主从存在频繁全量同步 4.value值过大 5.redis慢查询为了模拟redis服务器cpu100%，临时买了一台阿里云ecs，并把那天清空前的redis备份还原到服务器...

python3 操作连接redis5.0集群

u010674101的专栏

04-07

456

info python 3.6 redis 5.0 cluster centos 7.7 install pip3 install redis-py-cluster demo get redis Cluster keys from rediscluster import RedisCluster from redis._compat import xrange startup_nodes...

redis CPU高

wangleshisei的博客

07-11

397

1、实时监控（查是否有高消耗命令keys * hgetall flushall 也能查热key）redis-cli -p 端口 -a 密码 monitor >文件里面。slowlog-log-slower-than 慢于多少单位（微秒）redis-cli -p 端口 -a 密码 client list。redis-cli -p 端口 -a 密码 --hotkeys。cmd=ping和auth较多可能是短链接消耗CPU。slowlog-max-len 记录多少条慢sql。

redis进程占用CPU很高-达到100

常城的专栏

10-23

1万+

问题说明：监控发现，redis进程占用CPU很高-达到100%。并且会有2个redis进程。如下图：分析了一下，因为redis在持久化保存的时候，会fork出一个进程来。仔细观察进程号PID，会发现，占用CPU很高的那个进程，不是redis的主进程。而是fork出来的那个。这个fork出来的进程，由于任务就是持久化，所以它的工作，就是把内存中的数据（此时内存

redis导致java的cpu过高,redis 漏洞造成服务器被入侵-CPU飙升

weixin_39958631的博客

03-12

736

前言前几天在自己服务器上搭了redis，准备想着大展身手一番，昨天使用redis-cli命令的时候，10s后，显示进程已杀死。然后又试了几次，都是一样的结果，10s时间，进程被杀死。这个时候我还没发现事情的严重性。发现问题进程莫名被杀死，可能是cpu被占满，赶紧看了一下cpu。[root@vm_0_13_centos etc]# top果然如此，cpu被莫名的占满了。简单，根据pid杀死进程就行了...

如何监控mysql,redis运行状况（CPU,内存）

01-08

本文将深入探讨如何监控MySQL和Redis的CPU与内存使用情况。一、MySQL监控 1. **MySQL内置监控**：MySQL提供了一些内置的性能监控工具，例如`SHOW STATUS`和`SHOW VARIABLES`命令，可以查看服务器状态和配置参数。...

线上占用CPU过高问题排查

01-09

表象：服务挂了，CPU占用比较高，一直在百分之九十多。肯定有小伙伴会说常规操作，reboot一下完事儿了。其实这样吧没毛病，但是解决不了根本问题。啥也不多说。咱们先说下线上排查三板斧。就算不能解决问题也能猜个...

解码Redis最易被忽视的CPU和内存占用高问题

sssspider的博客

09-26

6181

我们在使用Redis时，总会碰到一些redis-server端CPU及内存占用比较高的问题。下面以几个实际案例为例，来讨论一下在使用Redis时容易忽视的几种情形。一、短连接导致CPU高某用户反映QPS不高，从监控看CPU确实偏高。既然QPS不高，那么redis-server自身很可能在做某些清理工作或者用户在执行复杂度较高的命令，经排查无没有进行key过期删除操作，没有执行复杂度高的命令。 ...

redis 漏洞造成服务器被入侵-CPU飙升

weixin_45728370的博客

10-09

441

生产环境RedisCPU飙高怎么办

iceblueba的博客

08-18

3186

生产环境99.9%的问题都来自于变更，出现问题立即拉起所有相关人员同步问题。

程序读写Redis导致CPU占用率/使用率过高原因及解决方法

iandbeyond的博客

05-19

5608

现象：自主编写的读写REDIS程序CPU最高使用率可达98%，偶尔伴随读写redis超时；解决方法：主要原因是因为redis的配置文件中最大连接数maxclients采用了默认设置，修改配置文件将最大连接数改为10000后，平台内所有读写redis的应用CPU使用率恢复正常，且读写redis timeout情况消失。 ...

Redis CPU使用率过高问题的排查

运用之妙,存乎一心

02-09

2万+

Redis CPU占用过高会导致所有使用Redis的客户端性能大幅下降，可能的原因中其中一个是大量的请求，尤其是keys命令请求过多，查询流程：1. 使用info和monitor命令(这两个命令也可以登录之后使用，不过有可能造成client的crash)redis-cli -h 192.168.1.xx -a 'xxx' info redis-cli -h 192.168.1.xx -a 'x...

Redis交互速度慢，CPU占用100%，集群方案，报错等问题

日常记录

12-04

1719

## 问题描述：执行top命令发现redis占用达到100% redis交互速度慢，一次要几十到一百毫秒一次 ## 解决思路查看redis数据量，比如我这里达到了30万经过本地测试，redis交互的速度跟redis交互量成正比，也就是说redis没数据时交互在10ms以内，数据量大的话一次可能花费更久的时间 ## 集群方案我在本地虚拟机建立了3个主节点3个从节点的redis集群，经过压力测试单节点情况cpu占到30%；改为集群模式redis每个节点占用在10%以下可以得出结论集群方案确实能降

【Redis 故障排查】「连接失败问题排查和解决」带你总体分析CPU及内存的使用率高问题排查指南及方案

世界上并没有完美的程序，但是我们并不因此而沮丧，因为写程序就是一个不断追求完美的过程。

02-14

1996

高消耗资源的命令即时间复杂度为O(N)或更高的命令，通常情况下，命令时间复杂度越高，在执行时消耗的资源越高，这会导致CPU使用率超高，容易触发主备倒换。slowlog-log-slower-than：如果在Redis实例的数据节点中执行一个命令，执行时间超过了slowlog-log-slower-than参数设置的阈值（单位为微秒），则会被记录到慢查询中。慢查询功能会记录执行超过指定时间阈值的命令，通过分析慢查询的语句和执行时长可帮助您找出高消耗命令，具体操参见慢查询。删除后，信息将永远丢失。

一次线上redis实例cpu占用率过高问题优化（转）

weixin_30511039的博客

08-09

682

前情提要：最近接了大数据项目的postgresql运维，刚接过来他们的报表系统就出现高峰期访问不了的问题，报表涉及实时数据和离线数据，离线读pg，实时读redis。然后自然而然就把redis也挪到我们这边优化了 -_-! 。在这次优化过程中也是再次深刻感受到redis的各种坑现象：大数据报表周末晚上高峰期实时报表打不开，基本上处于不能使用状态，实时报表主要访问redi...

poll cpu过高

07-10

<think>我们正在解决CPU使用率过高的问题。根据引用内容，我们可以总结出以下步骤： 1. 确定CPU占用高的进程（WHO） 2. 确定问题所在（WHERE） 3. 解决问题（HOW）具体步骤：一、确定CPU占用高的进程（WHO）使用系统监控工具（如top, htop, ps）找出占用CPU高的进程。二、确定问题所在（WHERE）在找到高CPU占用的进程后，进一步定位到该进程中的具体线程或代码部分。 - 对于Java应用，可以使用jstack等工具获取线程堆栈，分析线程状态。 - 对于其他应用，可以使用perf, strace等工具进行性能分析。三、解决问题（HOW）根据定位到的原因，采取相应的优化措施： - 如果是死循环，优化代码逻辑，避免无限循环。 - 如果是资源竞争（如锁竞争），优化同步机制。 - 如果是算法效率低，优化算法。 - 如果是外部依赖（如数据库查询慢），优化外部依赖。此外，引用[4]特别提到嵌入式系统中死循环的排查，建议检查循环中是否缺少睡眠机制（sleep），避免线程持续占用CPU。下面，我们将详细展开这些步骤。</think>### 如何解决CPU使用率过高的问题解决CPU使用率过高问题需遵循系统化排查流程，以下是关键步骤： #### 一、定位高CPU进程（WHO） 1. **系统级监控** - Linux/Mac：终端执行 `top` 或 `htop`，观察 `%CPU` 列 - Windows：任务管理器 → 性能标签 → 查看进程CPU占用 - 命令示例： ```bash top -c # 显示完整命令 ps -eo pid,pcpu,comm --sort=-pcpu | head -10 # 按CPU排序 ``` #### 二、定位问题根源（WHERE） 1. **线程级分析** - Java应用： ```bash jstack <PID> > thread_dump.txt # 获取线程堆栈 jcmd <PID> Thread.print # 替代方案 ``` - 通用方法： ```bash top -H -p <PID> # 查看特定进程的线程占用 perf top -p <PID> # 实时分析函数调用 ``` 2. **代码热点检测** - 使用性能分析工具： - `perf record` + `perf report`（Linux） - VisualVM/Arthas（Java） - Py-Spy（Python） - 检查高频调用函数与循环逻辑 #### 三、针对性解决（HOW） 1. **代码优化** - 修复死循环：检查 `while/for` 是否缺少退出条件 - 避免阻塞操作：异步处理I/O或网络请求 - 算法优化：降低时间复杂度（如用哈希表替代嵌套循环） - 示例修正： ```java // 错误示例：无休眠的循环 while (true) { processData(); } // 修正：添加休眠 while (true) { processData(); Thread.sleep(100); // 释放CPU时间片[^4] } ``` 2. **资源管理** - 线程池优化：限制并发线程数（如Java的 `ThreadPoolExecutor`） - 减少锁竞争：用无锁数据结构或减小锁粒度 - 缓存优化：避免重复计算（如用Redis缓存热点数据） 3. **环境调优** - JVM参数调整：合理设置堆大小（`-Xmx`），选择高效GC算法 - 内核参数：调整 `sysctl.conf` 网络连接参数（如 `net.core.somaxconn`） - 硬件升级：增加CPU核心数或使用更高主频处理器 4. **监控与验证** - 部署APM工具：Prometheus+Grafana持续监控 - 压力测试：用JMeter模拟流量验证优化效果 - 灰度发布：逐步验证修复版本稳定性[^3] > **关键提示**：嵌入式系统需特别检查硬件中断风暴（如异常传感器信号）和驱动兼容性[^4]。