记一次 MongoDB 占用 CPU 过高问题的排查

最新推荐文章于 2024-03-11 10:17:55 发布

DILIGENT203

最新推荐文章于 2024-03-11 10:17:55 发布

阅读量1.1w

点赞数 3

CC 4.0 BY-SA版权

分类专栏：技术分享文章标签： mongodb cpu 服务治理运维索引

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/DILIGENT203/article/details/83785127

技术分享专栏收录该内容

14 篇文章

订阅专栏

本文介绍如何通过分析 MongoDB 的当前操作、启用慢请求日志及优化索引，来解决 CPU 占用率异常升高的问题。文章详细解释了全表扫描、索引设置不合理及大量数据排序对 CPU 消耗的影响，并提供了具体的解决策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 引言

今天查看监控无意间突然发现自己的服务器上，CPU 占用率飙升到 100%，load 升到 10 以上，登录的响应已经达到半分钟。
马上运行 top，发现主要是 mongodb 占用了大量的 CPU，这是为什么呢？又该如何解决呢？

#此处有图片

2. 分析正在执行的请求

通过运行命令：

db.currentOp()

我们可以看到数据库当前正在执行的操作：

#此处有图片

2.1. 官方文档

https://docs.mongodb.com/manual/reference/method/db.currentOp/?spm=a2c4e.11153940.blogcont73389.10.2c402b90x4iad1。

2.2. 包含信息

主要有以下信息：

client – 请求是由哪个客户端发起的
opid – 操作的opid，有需要的话，可以通过 db.killOp(opid) 杀死操作
secs_running/microsecs_running – 请求运行的时间，如果这个值特别大就非常值得注意
query/ns: 对集合进行的具体操作
lock*：锁相关参数

3. 开启慢请求日志

MongoDB 支持 profiling 功能，将请求的执行情况记录到同DB下的 system.profile 集合里，profiling 有3种模式：

0 – 关闭 profiling
1 – 针对慢请求 profiling，将超过一定阈值的请求，记录到system.profile 集合
2 – 针对所有请求开启 profiling，将所有请求的执行都记录到 system.profile 集合

3.1. 通过命令开启

推荐在生产环境中设置为 1，开启慢请求日志，方便问题的暴露和排查，可以通过下面命令设置 profiling 级别：

db.setProfilingLevel(1, { slowms: 20 })

{ slowms: 20 } 参数就是慢请求执行阈值，单位是毫秒。

3.2. 通过配置文件开启

也可以通过配置文件开启：

operationProfiling：
  mode: slowOp
  slowOpThresholdMs： 100

3.3. 查看慢请求记录

下面的命令中我们获取了最近的3条慢请求记录：

db.system.profile.find().sort({$natrual: -1}).limit(3)

4. 慢请求分析 – 全表扫描 COLLSCAN

如果在日志中看到关键字 COLLSCAN，说明该查询在进行全表扫描，通常这就是 CPU 异常飙高的主要原因。

4.1. 查看扫描文档数

system.profile 里 docsExamined 的值显示了本次查询的扫描文档数。

4.2. 解决办法 – 添加索引

最好针对查询语句建立索引：

db.col.createIndex({"title":1})

我们也可以在添加索引时增加传入可选参数，例如，在生产环境我们通常不希望索引添加的操作阻塞其他数据库操作，这时就需要务必添加 background 参数：

db.col.createIndex({"title":1}, {'background', true})

5. 慢请求分析 – 索引设置不合理

有的时候，请求即使查询走了索引，执行也很慢，通常是因为索引建立不太合理或者匹配结果太多。
索引通常应该建立在区分度大的字段上。
在 system.profile 中，可以通过 keysExamined 字段查看查询扫描了多少条索引，如果该值过大，要考虑建立新的索引或优化查询了。

6. 慢请求分析 – 大量数据排序

当查询请求里包含排序的时候，如果排序无法通过索引满足，MongoDB 会在内存中对结果进行排序。
大家都知道，排序是非常消耗 CPU 的一项操作，最好在需要排序的字段上建立索引。

system.profile 中的 SORT 关键字反映了查询需要排序。

7. 服务能力评估

有时 CPU 消耗过高仅仅是单纯的因为服务器达到了上限。
如果上面的措施都无法让 CPU 占用率下降到合理的指标内，就要考虑扩容、升级来提升服务能力的上限。
但切忌将这个方法作为首要考虑的解决方案，合理的设置索引，建立资源预警，而不是盲目提升配置或在业务已经达到上限时再考虑优化。

8. 参考资料

https://docs.mongodb.com/manual/reference/method/db.currentOp/?spm=a2c4e.11153940.blogcont73389.10.2c402b90x4iad1。
https://docs.mongodb.com/manual/tutorial/manage-the-database-profiler/?spm=a2c4e.11153940.blogcont73389.11.2c402b90x4iad1。
https://docs.mongodb.com/manual/reference/database-profiler/?spm=a2c4e.11153940.blogcont73389.13.2c402b90WPcbsr。
https://yq.aliyun.com/articles/73389。
http://www.runoob.com/mongodb/mongodb-indexing.html。

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。