这部技术葵花宝典真的很硬核

本文分享了线上应用故障排除的实战经验,包括CPU占用过高、内存溢出、业务问题排查及BOSS统计需求的应对策略,通过具体命令操作,帮助开发者快速定位并解决问题。

【这是一猿小讲的第 35 篇原创分享】

你有没有经历过:一大早就被疯狂的报警炸醒,由于线上应用 CPU 占用率过高 ......


你有没有经历过:刚到公司,板凳还没有捂热,收件箱里却一堆的客服投诉邮件,需要你排查日志定位问题 ...... 


你有没有经历过:下班的钟声即将敲响,但是你还要加班,进行统计应用每秒、每分钟的峰值等各个指标 ,由于 BOSS 要拿这些指标,在明天的技术大会上对外吹牛 ......


你有没有经历过:深夜正在酣眠,值班的运维疯狂给你打 CALL,由于线上应用内存出现了问题 ......

我敢保证上面的场景,大概率你都经历过。讲真,其实无论你是否经历过,今天你都算来着啦。因为我将要结合以往的经历总结,在猿门开坛设法,掏出葵花宝典施展一二。


水滴石穿非一日之功,冰冻三尺非一日之寒,罗马并非一日建成的,经验也并非一坑而促成的,防狼有术,我们先从全局,看一看这部技术宝典(看不清没关系,感觉到很牛掰就行)。

640?wx_fmt=png


这部技术宝典真的很硬核,主要分四大招,见招拆招,让我们一一进行拆解。

第 1 招:线上应用占用 CPU 过高。

640?wx_fmt=png拆~招:

采用 top 命令,找出 CPU 占用最高的进程 PID;	
通过 ps -ef | grep PID 查看对应的应用,看看是谁在作祟;	
采用 jstack -l  PID >> PID.log 获取进程的堆栈信息;	
采用 ps -mp PID -o THREAD,tid,time 拿到占用 CPU 最高的线程 tid;	
采用 printf "%x\n" tid 获取 16 进制的线程 TID;	
采用 grep TID -A20 PID.log 确定是线程哪儿出了问题。

最~后:腿疼医腿,辨症施治,对症下药。找准代码位置,进行调整代码。

 2 招:线上应用内存溢出。

640?wx_fmt=png拆~招:

采用 top 命令,找出应用对应的 PID;	
采用 jmap -heap PID 确认一下分配的内存少不少;	
采用 jmap -histo:live PID | more 找出分析最耗内存的对象【留意占用多少G的对象】;	
采用 ps -efL | grep PID | wc -l 查看进程创建的线程数;	
采用 ll /proc/PID/task | wc -l 也可以查看进程创建的线程数;	
采用 netstat -apn | grep PID | wc -l 查看进程网络连接数。

最~后:腿疼医腿,辨症施治,对症下药。

a. 如果内存分配确实小,适当调整内存;	
b. 对象被频繁创建,且不释放,优化代码;	
c. 不断创建线程或者不断进行网络连接,优化代码。

 3 招:排查业务问题。


640?wx_fmt=png拆~招:

采用 tail -fn 200 log_file 实时查询线上日志;	
找准日志搜所关键字keyWord,例如 orderId、mobileId、reqId 等;	
采用 grep keyWord log_file 查询关键字所在的行的日志;	
采用 grep -C n keyWord log_file 匹配关键字所在行的上下 n 行;	
采用 grep keyWord log_file | wc -l 匹配关键字的的行数有多少。

最~后:根据实际排查日志场景进行日志搜索 tail 、grep 用的最多。

 4 招:BOSS 的统计问题。

640?wx_fmt=png拆~招:

采用 cat log_file 读取日志文件;	
采用 cut 命令截取出日志的时间戳;	
若按照秒统计截取到秒;若按照分钟统计截取到分钟;	
采用 uniq -c 进行去重统计;	
采用 sort -nr 按照第一列的数值大小进行倒序;	
采用 head -1 只显示第一行内容。

最~后:统计问题迎刃而解,那么统计每秒峰值的命令该如何写呢?

例如日志: 

1118 115856 066 - REQID0000000000188 ... ...

命令组合:

SecondPeak=`cat log_file|cut -d, -f1| cut -c 1-11|sort|uniq -c |sort -nr|head -1`

好了,今天的分享接近尾声,不知道你 get 到多少,懂与不懂,都建议你收藏,以备不时之需;如果想让更多人进步,那不妨发扬一下分享的精神,动动你的手指放肆的转发一下。

640?wx_fmt=png

推荐阅读:

玩弄日志归集于手掌之中

傻瓜也能玩转日志归集

程序慢的像蜗牛,我该怎么办?

机器学习如何为业务赋能?

妈妈再也不用担心,我学不会大数据 flink 啦

Java系列爱情故事推荐:

爱情36技之追美妹的技术

爱情36技之暗送秋波的技术

爱情36技之趣味相投

爱情36技之Bug大战

爱情36技之猿门授渔

爱情36技之记忆永存

本指南详细阐述基于Python编程语言结合OpenCV计算机视觉库构建实时眼部状态分析系统的技术流程。该系统能够准确识别眼部区域,并对眨眼动作与持续闭眼状态进行判别。OpenCV作为功能强大的图像处理工具库,配合Python简洁的语法特性与丰富的第三方模块支持,为开发此类视觉应用提供了理想环境。 在环境配置阶段,除基础Python运行环境外,还需安装OpenCV心模块与dlib机器学习库。dlib库内置的HOG(方向梯度直方图)特征检测算法在面部特征定位方面表现卓越。 技术实现包含以下关键环节: - 面部区域检测:采用预训练的Haar级联分类器或HOG特征检测器完成初始人脸定位,为后续眼部分析建立基础坐标系 - 眼部精确定位:基于已识别的人脸区域,运用dlib提供的面部特征点预测模型准确标定双眼位置坐标 - 眼睑轮廓分析:通过OpenCV的轮廓提取算法精确勾勒眼睑边缘形态,为状态判别提供几何特征依据 - 眨眼动作识别:通过连续帧序列分析眼睑开合度变化,建立动态阈值模型判断瞬时闭合动作 - 持续闭眼检测:设定更严格的状态持续时间与闭合程度双重标准,准确识别长时间闭眼行为 - 实时处理架构:构建视频流处理管线,通过帧捕获、特征分析、状态判断的循环流程实现实时监控 完整的技术文档应包含模块化代码实现、依赖库安装指引、参数调优指南及常见问题解决方案。示例代码需具备完整的错误处理机制与性能优化建议,涵盖图像预处理、光照补偿等实际应用中的关键技术点。 掌握该技术体系不仅有助于深入理解计算机视觉原理,更为疲劳驾驶预警、医疗监护等实际应用场景提供了可靠的技术基础。后续优化方向可包括多模态特征融合、深度学习模型集成等进阶研究领域。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值