MongoDB-运行状态、性能监控，分析

最新推荐文章于 2024-08-08 11:26:03 发布

转载最新推荐文章于 2024-08-08 11:26:03 发布 · 544 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：https://www.cnblogs.com/renyb/archive/2013/01/18/2866632.html

MongoDB 专栏收录该内容

25 篇文章

订阅专栏

mongodb监控工具mongostat

mongostat的使用及命令详解

mongostat是mongodb自带的状态检测工具，在命令行下使用，会间隔固定时间获取mongodb的当前运行状态，并输出。

1、常用命令格式：

mongostat --host 192.168.11.11:27017 --username root --password 12345678 --authenticationDatabase admin

参数说明：

--host :指定IP地址和端口，也可以只写IP，然后使用--port参数指定端口号

--username：如果开启了认证，则需要在其后填写用户名

--password : 不用多少，肯定是密码

--authenticationDatabase：若开启了认证，则需要在此参数后填写认证库（注意是认证上述账号的数据库）

命令输出格式

2、各字段解释说明：

insert/s : 官方解释是每秒插入数据库的对象数量，如果是slave，则数值前有*,则表示复制集操作

query/s : 每秒的查询操作次数

update/s : 每秒的更新操作次数

delete/s : 每秒的删除操作次数

getmore/s: 每秒查询cursor(游标)时的getmore操作数

command: 每秒执行的命令数，在主从系统中会显示两个值(例如 3|0),分表代表本地|复制命令

注：一秒内执行的命令数比如批量插入，只认为是一条命令（所以意义应该不大）

dirty: 仅仅针对WiredTiger引擎，官网解释是脏数据字节的缓存百分比

used:仅仅针对WiredTiger引擎，官网解释是正在使用中的缓存百分比

flushes:

For WiredTiger引擎：指checkpoint的触发次数在一个轮询间隔期间

For MMAPv1 引擎：每秒执行fsync将数据写入硬盘的次数

注：一般都是0，间断性会是1，通过计算两个1之间的间隔时间，可以大致了解多长时间flush一次。flush开销是很大的，如果频繁的flush，可能就要找找原因了

vsize： 虚拟内存使用量，单位MB （这是在mongostat 最后一次调用的总数据）

res: 物理内存使用量，单位MB （这是在mongostat 最后一次调用的总数据）

注：这个和你用top看到的一样, vsize一般不会有大的变动， res会慢慢的上升，如果res经常突然下降，去查查是否有别的程序狂吃内存。

qr: 客户端等待从MongoDB实例读数据的队列长度

qw：客户端等待从MongoDB实例写入数据的队列长度

ar: 执行读操作的活跃客户端数量

aw: 执行写操作的活客户端数量

注：如果这两个数值很大，那么就是DB被堵住了，DB的处理速度不及请求速度。看看是否有开销很大的慢查询。如果查询一切正常，确实是负载很大，就需要加机器了

netIn:MongoDB实例的网络进流量

netOut：MongoDB实例的网络出流量

注：此两项字段表名网络带宽压力，一般情况下，不会成为瓶颈

conn: 打开连接的总数，是qr,qw,ar,aw的总和

注：MongoDB为每一个连接创建一个线程，线程的创建与释放也会有开销，所以尽量要适当配置连接数的启动参数，maxIncomingConnections，阿里工程师建议在5000以下，基本满足多数场景

这篇文章的目的是让你知道怎么了解你正在运行的Mongdb是否健康。

mongostat详解

mongostat是mongdb自带的状态检测工具，在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态，并输出。如果你发现数据库突然变慢或者有其他问题的话，你第一手的操作就考虑采用mongostat来查看mongo的状态。

它的输出有以下几列：

inserts/s 每秒插入次数
query/s 每秒查询次数
update/s 每秒更新次数
delete/s 每秒删除次数
getmore/s 每秒执行getmore次数
command/s 每秒的命令数，比以上插入、查找、更新、删除的综合还多，还统计了别的命令
flushs/s 每秒执行fsync将数据写入硬盘的次数。
mapped/s 所有的被mmap的数据量，单位是MB，
vsize 虚拟内存使用量，单位MB
res 物理内存使用量，单位MB
faults/s 每秒访问失败数（只有Linux有），数据被交换出物理内存，放到swap。不要超过100，否则就是机器内存太小，造成频繁swap写入。此时要升级内存或者扩展
locked % 被锁的时间百分比，尽量控制在50%以下吧
idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
q t|r|w 当Mongodb接收到太多的命令而数据库被锁住无法执行完成，它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度，都为0的话表示mongo毫无压力。高并发时，一般队列值会升高。
conn 当前连接数
time 时间戳

使用profiler

类似于MySQL的slow log, MongoDB可以监控所有慢的以及不慢的查询。

Profiler默认是关闭的，你可以选择全部开启，或者有慢查询的时候开启。

>use test

switched to db test

>db.setProfilingLevel(2);

{"was" : 0 , "slowms" : 100, "ok" : 1} // "was" is the old setting

>db.getProfilingLevel()

查看Profile日志

> db.system.profile.find().sort({$natural:-1})
{"ts" : "Thu Jan 29 2009 15:19:32 GMT-0500 (EST)" , "info" :
"query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query: { profile: 2 } nreturned:1 bytes:50" ,
"millis" : 0} ...

3个字段的意义

ts：时间戳
info：具体的操作
millis：操作所花时间，毫秒

不多说，此处有官方文档。注意，造成满查询可能是索引的问题，也可能是数据不在内存造成因此磁盘读入造成。

使用Web控制台

Mongodb自带了Web控制台，默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000，如果是默认的Mongodb数据服务端口(Which is 27017)，则相应的Web端口为28017

这个页面可以看到

当前Mongodb的所有连接
各个数据库和Collection的访问统计，包括：Reads, Writes, Queries, GetMores ,Inserts, Updates, Removes
写锁的状态
以及日志文件的最后几百行（CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)

可以参考右边的截图

db.stat()

获取当前数据库的信息，比如Obj总数、数据库总大小、平均Obj大小等

> use test
switched to db test
> db.stats()
{
    "collections" : 9,
    "objects" : 4278845,
    "avgObjSize" : 224.56603031892953,
    "dataSize" : 960883236,
    "storageSize" : 1195438080,
    "numExtents" : 59,
    "indexes" : 13,
    "indexSize" : 801931264,
    "fileSize" : 6373244928,
    "ok" : 1
}

db.serverStatus()

获取服务器的状态

{
"version" : "1.6.5",
"uptime" : 7208469,
"uptimeEstimate" : 7138829,
"localTime" : "Wed Oct 26 2011 22:23:07 GMT+0800 (CST)",
"globalLock" : {
"totalTime" : 7208469556704,
"lockTime" : 4959693717,
"ratio" : 0.000688036992871448,
"currentQueue" : {
"total" : 0,
"readers" : 0,
"writers" : 0
}
},
"mem" : {
"bits" : 64,
"resident" : 3131,
"virtual" : 6172,
"supported" : true,
"mapped" : 4927
},
"connections" : {
"current" : 402,
"available" : 2599
},
"extra_info" : {
"note" : "fields vary by platform",
"heap_usage_bytes" : 832531920,
"page_faults" : 8757
},
"indexCounters" : {
"btree" : {
"accesses" : 2821726,
"hits" : 2821725,
"misses" : 1,
"resets" : 0,
"missRatio" : 3.543930204420982e-7
}
},
"backgroundFlushing" : {
"flushes" : 120133,
"total_ms" : 73235923,
"average_ms" : 609.6236920746173,
"last_ms" : 1332,
"last_finished" : "Wed Oct 26 2011 22:22:23 GMT+0800 (CST)"
},
"cursors" : {
"totalOpen" : 0,
"clientCursors_size" : 0,
"timedOut" : 238392
},
"repl" : {
"ismaster" : true
},
"opcounters" : {
"insert" : 269351,
"query" : 19331151,
"update" : 14199331,
"delete" : 1,
"getmore" : 145575,
"command" : 55982302
},
"asserts" : {
"regular" : 0,
"warning" : 0,
"msg" : 0,
"user" : 27,
"rollovers" : 0
},
"ok" : 1
}

需要关心的地方：

connections 当前连接和可用连接数，听过一个同行介绍过，mongodb最大处理到2000个连接就不行了（要根据你的机器性能和业务来设定），所以设大了没意义。设个合理值的话，到达这个值mongodb就拒绝新的连接请求，避免被太多的连接拖垮。
indexCounters:btree:misses 索引的不命中数，和hits的比例高就要考虑索引是否正确建立。
- 你看我的”missRatio” : 3.543930204420982e-7，很健康吧。所以miss率在mongostat里面也可以看
其他的都能自解释，也不是查看mongo健康状况的关键，就不说明了。

db.currentOp()

Mongodb 的命令一般很快就完成，但是在一台繁忙的机器或者有比较慢的命令时，你可以通过db.currentOp()获取当前正在执行的操作。

在没有负载的机器上，该命令基本上都是返回空的

`1`	`> db.currentOp()`

`2`	`{` `"inprog"` `: [ ] }`

以下是一个有负载的机器上得到的返回值样例：

`1`	`{` `"opid"` `:` `"shard3:466404288",` `"active"` `:` `false,` `"waitingForLock"` `:` `false,` `"op"` `:` `"query",` `"ns"` `:` `"sd.usersEmails",` `"query"` `: { },` `"client_s"` `:` `"10.121.13.8:34473",` `"desc"` `:` `"conn"` `},`

字段名字都能自解释。如果你发现一个操作太长，把数据库卡死的话，可以用这个命令杀死他

`1`	`> db.killOp("shard3:466404288")`

MongoDB Monitoring Service

MongoDB Monitoring Service(MMS)是Mongodb厂商提供的监控服务，可以在网页和Android客户端上监控你的MongoDB状况。

本文转载自：http://tech.lezi.com/archives/290