- 博客(5)
- 收藏
- 关注
原创 判断文章内容重复率的算法实现
需求背景: http://3g.k.sohu.com/t/n384943815,如这篇搜狐新闻,内容存在明显重复,那为了保障线上文章质量,我们需要对文章段落进行判重。于是我们需要一个判重的逻辑和标准算法逻辑: 获取文章段落,根据换行符\r、\n、<br/>、</br>进行分割,再循环段落,逐一与下一个段落进行比较,计算段落间的重复率(计算两字符间...
2019-09-04 11:54:41
5419
1
原创 某服务器CPU使用率达到99%,排查是哪个程序哪个线程导致的高CPU
思路:1、先找到耗CPU高的进程;2、找到耗CPU高的线程;3、找到耗CPU高的线程对应的业务代码;操作:1.1、执行“top -c”命令,显示进程运行信息列表,键入大写P,按CPU使用率降序排列:1.2、获取到进程PID为10765的进程,使用CPU资源最高19.9%;至此,已找到耗CPU最高的进程,进程PID为10765,后续命令中需要使用到。2.1、...
2019-08-13 17:50:44
2589
原创 某java应用大量消耗内存,导致频繁FullGC怎么处理
思路:1、什么对象消耗内存最大;2、是否创建了太多的线程;3、新生的、老年代现在内存使用情况,确认是不是整体内存分配太小了;4、实时查看新生的、老年代内存使用情况,GC情况5、代码层检查,是否有大对象创建?需要调用close()或dispose()来回收的资源是否回收了?操作:1、执行“jmap -histo:live 10765 | more”命令,以表格的方式...
2019-08-13 17:46:05
2117
1
原创 记录一次日志打印错误,日期错乱的排坑过程
现象:本地日志配置采用log4j,配置文件如下:正常日志打印应该是:今天info日志打在server.log里,到第二天,假如是2019-07-30,昨天的日志应该重命名为server.log.2019-07-29,今天日志照常打印在server.log里然而,诡异的是,2019-07-30当天的线上日志打印在了2019-07-29,而2019-07-29日的日志归档到了serve...
2019-07-31 16:08:20
2095
2
转载 JAVA反射机制实例教程
本文以实例形式详细讲述了Java的反射机制,是Java程序设计中重要的技巧。分享给大家供大家参考。具体分析如下:首先,Reflection是Java 程序开发语言的特征之一,它允许运行中的 Java 程序对自身进行检查,或者说"自审",并能直接操作程序的内部属性。例如,使用它能获得 Java 类中各成员的名称并显示出来。 Java 的这一能力在实际应用中也许用得不是很多,但是在其它的程序设计语
2015-11-28 15:58:49
276
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅