大数据
王瑞恒
为了技术而努力,为了兴趣而工作.
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucene根据document获取词频
在lucene过程中可能会遇到需要获取在单个文章中词频,可以使用一下方法: long cp = 0; TokenStream tokenStream = null; try { tokenStream = analyzer.tokenStream("neirong", new StringReader(doc.get("neirong"))); CharTermAttribut...原创 2019-09-17 18:07:46 · 477 阅读 · 0 评论 -
lucene-KAnalyzer基本用法,自定义词库
下载地址:https://github.com/wangruiheng/IK 下载之后导入eclipse项目 修改ext.dic文件,加入扩展词,打包上传到maven服务器,所要用的项目引入,然后使用IK分词器生成索引 示例代码(生成索引): package com.lucene.doc.util; import java.nio.file.Paths; import or...原创 2019-09-17 18:27:58 · 458 阅读 · 0 评论
分享