
Lucene系列
iteye_12007
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Lucene的同步法则
避免出现同步问题: 1、在同一时刻,Lucene的索引只允许有一个进程对其进行加入文档、删除文档、更新索引等操作。 2、在同一时刻,Lucene的索引允许多个线程同时对其进行检索。 也即: 1、任一时刻,在系统中只能有一个IndexWriter的实例对索引进行操作不允许有多个IndexWriter向索引添加Document,或是优化索引、合并segmen...原创 2011-07-11 20:34:16 · 220 阅读 · 0 评论 -
TF/IDF算法
一直说TF-IDF,终于开始做真正的TF-IDF。 TF/IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。 一。TF/IDF描述单个term与特定document的相关性 TF(Term Frequency): 表示一个term与某个document的相关性。 公式为这个term在documen...原创 2011-10-07 09:19:20 · 234 阅读 · 0 评论