服务器
伦无次语
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
记一次线上文件数打开过多的问题(一)
问题 线上服务忽然宕机,导致应用全部异常退出拒绝服务,运维同学反馈线上app无法登录了。 查找原因 直觉告诉我,又是数据库挂了(之前有过先例),已经做好了最坏的打算,准备去kill process了,打开阿里云后台,结果发现数据库一切正常。 然后去看应用服务的监控,结果发现没有任何监控数据,开始以为是monitor也一起挂掉了,后来才知道是因为应用挂掉,导致数据无法采集才产生了CPU、内存等数据全...原创 2018-10-15 03:29:45 · 1064 阅读 · 0 评论 -
记一次线上文件数打开过多的问题(二)
分析 之前分析对文件数打开过多的原因可能存在如下三个地方: 分布式锁 异步定时任务 异步写日志 下面一个一个分析。 分布式锁 分布式锁是采用redis实现的,加入了自旋的功能(redis做分布式锁终归不是一个很好的方案),但是代码中使用这个锁的地方不止一处,之前都一直没有出问题,所以先放一边。 异步写日志 由于查看lsof,是sock一直在增长,考虑是网络连接没有正常释放的问题,用到网络连接...原创 2018-10-16 02:07:48 · 797 阅读 · 0 评论 -
简易服务健康检查工具
现在大部分公司都在推进微服务改造,微服务带来的便利性显而易见,服务拆分后每个微服务功能独立,可以独立部署和弹性伸缩,单个服务的可维护性大大增强,但是随之而来的问题也不少,服务的调用链路变长,中间的问题就会增加;服务增加后,服务的管理也是一个大问题。 公司的部署方式是N个docker容器部署在同一台测试机器,然后通过Nginx转发请求到对应的服务,但是奇怪的是如果其中某台服务down掉,会造成其他服...原创 2018-10-17 03:27:52 · 1054 阅读 · 0 评论
分享