- 博客(2)
- 收藏
- 关注
原创 大数据之关键词提取--算法介绍TF-IDF
spark TF-IDF特征提取生成文章关键词 首先介绍下TF-IDF TF-IDF TF-IDF(term frequency–inverse document frequency)中文”词频-逆向文件频率”,通过它将文本特征向量化,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 ...
2018-09-29 23:27:41
3168
原创 动态加载数据库驱动包
最近接到一个比较恶心的需求,里面有一个小功能,使用不同的数据库驱动动态连接数据库,搞了一个测试demo,废话少说直接上代码 package com.aotain.taskmgr; import java.net.URL; import java.net.URLClassLoader; import java.sql.Connection; import java.sql.Driver; ...
2018-08-16 23:27:21
1388
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人