- 博客(11)
- 收藏
- 关注
转载 有关Lucene的问题(3): 向量空间模型与Lucene的打分机制
http://www.cnblogs.com/forfuture1978/archive/2010/02/06/1664916.html问题:在你的文章中提到了:于是我们把所有此文档中词(term)的权重(term weight) 看作一个向量。 Document = {term1, term2, …… ,term N} Document V
2015-06-03 14:40:30
399
转载 利用lucene获取tf-idf
http://www.tianyalinfeng.com/post/530package baike;import java.io.File;import java.util.List;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.standard.StandardAna
2015-06-03 11:18:09
2215
1
转载 Lucene TF-IDF 相关性算分公式
Lucene TF-IDF 相关性算分公式时间:2014-02-17 01:43:15 类别:搜索引擎 访问: 1491 次Lucene在进行关键词查询的时候,默认用TF-IDF算法来计算关键词和文档的相关性,用这个数据排序TF:词频,IDF:逆向文档频率,TF-IDF是一种统计方法,或者被称为向量空间模型,名字听起来很复杂,但是它其实只包含了两个简单规则某个词或短语在
2015-06-01 21:34:24
1260
转载 Java实现矩阵
import java.util.Random;//矩阵类public class Matrix {private int[][] matrix;Random random = new Random();// 构造方法public Matrix() {matrix = new int[3][3];}public M
2015-05-25 21:25:33
1026
原创 JAVA同一个类的函数(方法)之间的调用
直接调用public class T {public void aMethod(){bMethod();}public void bMethod(){System.out.println("B is working");}}
2015-05-25 16:38:29
5482
转载 hashmap\hashtable\Listmap的区别
一般情况下,我们用的最多的是HashMap,在Map 中插入、删除和定位元素,HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。如果需要输出的顺序和输入的相同,那么用LinkedHashMap 可以实现,它还可以按读取顺序来排列.HashMap是一个最常用的Map,它根据键的hashCode值存储数据,根据键可以直接获取它的值,具有很快的访问速度。
2015-05-25 14:44:44
567
原创 IKAnalyzer中文分词去停用词问题解决
采用的网上的代码怎么都去不掉停用词,最后下载了一个源码观察了stopword.dic和IKAnalyzer.cfg,是放到SRC和bin目录下都同时放的,我只是它们放到src下,所以导致只能分词不能去停用词,放到bin下之后就可以去停用词了,而且,支持stopword.dic扩充,很方便代码import java.io.IOException;import java.io.StringRea
2015-05-07 15:45:36
4164
转载 jena读取本体的三种方法
我初学jena,本体的读取问题一直困扰我。试验出了几种方法,供大家讨论:OntModel ontModel=ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);第一种方法:ontModel.read("file:E:/java/MeOntology.owl");里面也可以写成相对路径比如ontModel.read("file:.
2014-11-04 17:52:04
3221
转载 sparql查询范例
sparql查询实例SParsql语法:(后面的eg:是prifix中定义,指向建立的本体文件)1)查询某个类的子类名称Select ?x where {?x rdfs:subClassOf eg:类名. }2) 查询某个实例的某个属性值Select ?x where {eg:实例名称 eg:属性名称 ?x .}"3)查询某几列的数据,相当于sql: select a,b
2014-11-04 11:38:21
1377
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人