- 博客(6)
- 收藏
- 关注
原创 JAVA-使用前缀树(Tire树)实现敏感词过滤、词典搜索
简介有时候需要对用户输入的内容进行敏感词过滤,或者实现查找文本中出现的词典中的词,用遍历的方式进行替换或者查找效率非常低,这里提供一个基于Trie树的方式,进行关键词的查找与过滤,在词典比较大的情况下效率非常高。Trie树Trie树,又叫前缀树,多说无益,直接看图就明白了词典:[“猪狗”, “小狗”, “小猫”, “小猪”, “小屁孩”, “垃圾”, “狗东西”]Tire数据结构:余弦相似度private static double getSimilarity(String doc1, Str
2020-10-21 09:46:37
1641
原创 命令行版今日头条——上班“摸鱼”的好帮手
简介上班无聊怎么办?想刷新闻怎么办?怕被发现怎么办?命令行版今日头条帮你忙,摸鱼神器~喜欢请帮忙点下star项目说明项目地址功能:支持今日头条推荐入口的新闻支持新闻溯源单条标题显示,感兴趣的可以查看新闻内容操作说明方向键控制:下键切换新闻,左键查看内容,右键溯源下载地址下载地址...
2019-11-21 19:00:24
1088
原创 JAVA 别再问为什么CPU占用率100%
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,开发完成之后,发布到服务器上发现CPU占用一直是100%,糟了,多半是死循环的感觉。排查步骤1. 查看服务PIDjps服务kg_deep_tuple_extraction.jar是我们的服务,PID为316602. 使用top -p查看资...
2019-10-21 17:09:07
814
原创 tensorflow1.14-libtensorflow_framework.so.1 cannot open shared object file no such file or directory
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,身在nlp小组,自然要接触很多模型,我的任务就是tensoflow模型的工程部署,前不久我们开始使用tensorflow1.14,Estimator真香。所以对应Java这边也需要使用tf1.14导入graph,这里就来说说官方jar包的问题。报错Windows下无异常,Linux下服务启动时报:libtensorflow_fr...
2019-09-25 16:42:43
7107
54
原创 JAVA-简单实现文本相似度计算-余弦相似度
简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发。手上是一个消息监控的项目,需要实时把爬虫组爬到的新闻经过处理入库。今天来了个需求,需要对新闻做一个去重的处理,减少类似新闻的出现。我理性分析一波,应该就是要计算一下文本的相似度嗯嗯。。。那该怎么做呢。。。计算文本相似度方法文本的相似度计算方法可以分为两大类:基于深度学习的方法和基于非深度学习的方法。虽然小的我在自然语言处理与交...
2019-07-25 15:51:42
6462
原创 JAVA-SpringBoot+JPA+Druid多数据源配置完全版+有坑提示
SpringBoot+JPA+Druid多数据源配置完全版+有坑提示简介多数据配置需要注意的点(坑)体会参考简介在下是刚毕业的小萌新,现在在一家股票资讯公司做Java开发,手头上的项目(crud项目)本来是只连Mysql,现新增了功能需要连Postgre,于是哼哧哼哧开始了JPA的多数据源配置。经历一番轰轰烈烈的搜索,找了好几个多数据源的配置教程,就开始了我的模仿表演。没想到一步一个坑,经过几...
2019-07-25 11:15:40
4440
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人