mongodb报错:Problem inserting to mongo collection: no reachable servers
问题描述:
使用mgo操作mongo时遇到了上述的异常,原因是session的使用失败。
在程序启动时,我创建了一个主 mgo.Session,然后,对于每个处理的请求,我复制主会话( dbSession.Copy()
)并在完成后关闭它。
但是,当并发调 dbSession.Copy()
时,报错:Problem inserting to mongo collection: no reachable servers
问题分析:
原因1:
您可以使用/proc文件系统或lsof命令来查找进程使用的所有文件描述符。
lsof -p 进程id |wc -l //文件数量
ls /proc/进程id/fd |wc -l //文件描述符数量
在我的应用程序运行几个小时后,它停止工作,因为它无法打开另一个 MongoDB 连接,因为达到了限制 (1024)。
ulimit -a 用来显示当前的各种用户进程限制。 (通过ulimit -a 可以查看open files)
对于需要做许多 socket 连接并使它们处于打开状态的应用程序而言,
最好通过使用 ulimit -n xx 修改每个进程可打开的文件数,缺省值是 1024。
ulimit -n 4096 将每个进程可以打开的文件数目加大到4096,缺省为1024
原因2:
检查 mgo 会话后,我可以看到 Dial 设置,默认情况下 maxPoolSize 为 4096
mgo的session.go文件:
// PoolLimit defines the per-server socket pool limit. Defaults to 4096.
// See Session.SetPoolLimit for details.
PoolLimit int
//SetPoolLimit设置单个服务器中使用的套接字的最大数量
//在此会话之前,将阻止等待套接字可用。
//默认限制为4096。
//
//此限制必须设置为覆盖超过任何预期的应用程序。使用数据库驱动程序来定义应用程序的并发限制。 防止这样的并发性“在门口”,通过适当限制数量已使用资源的数量和goroutine的数量。
总结:就是说,我们并发会话的个数得小于这个值。
解决方案:
调大ulimit、控制你的并发协程数在 ulimit以及4096之下。