- 博客(5)
- 收藏
- 关注
原创 Lucene 4.0 原理与代码分析 - 相似度评分算法之向量空间模型(VSM)
搜索算法的核心实际是对搜索项之间相似度的打分策略,一个好的打分策略应该能够综合各种与搜索项内容相关并对搜索目的有帮助的所有因素,一般将这种策略叫做建模(modeling),由量化后的相关因素即特征(feature)构成检索(评分)模型,最后通过模型得到搜索项之间的相似度分数(similarity score)。 一般来讲相似度分数应该是与内容相关的程度成正比的,因此当计算过所有的搜索项的相似
2012-09-05 17:00:40
3628
原创 Lucene 4.0 原理与代码分析
Lucene是全世界最优秀的全文搜索引擎之一,其鼎鼎大名只要是对搜索有一定了解的朋友都一定会有所耳闻,他有着非常优秀的性能和可扩展性,因此有很多身份显赫的后代,比如Solr和Nutch,都是apache基金会下的顶级项目,其已成为工业搜索引擎的基础,可谓是搜索引擎的“事实标准”;于此同时,由于apache基金会的优良运作以及apache开源协议的友好支持,成千上万的搜索技术发烧友和爱好者为Luce
2012-09-05 16:09:11
787
原创 C#中Clone方法的链式继承复制实现
大多数稍微有过一些编程实践的C#初学者都应该听说过“浅层复制”和“深层复制”的区别,如果尚不清楚的盆友还是先去搜索一下相关的专题,我在这里不多说,本文主要内容是记录一下区别于前两者的另外一种在有较复杂的类层次情况下的复制方式。 比如有如下类的声明:(代码1) public class ClassOne { public int Value = 0; } public clas
2012-02-19 10:02:06
838
C#中Clone方法的链式复制实现
大多数稍微有过一些编程实践的C#初学者都应该听说过“浅层复制”和“深层复制”的区别,如果尚不清楚的盆友还是先去搜索一下相关的专题,我在这里不多说,本文主要内容是记录一下区别于前两者的另外一种在有较复杂的类层次情况下的复制方式。 比如有如下类的声明:(代码1) public class ClassOne { public int Value = 0; } pub...
2012-02-19 01:45:43
253
原创 Lucene 4.0 原理与代码札记
http://blog.youkuaiyun.com/forfuture1978/article/details/5668956 未完待续,敬请期待... 作者:KeViNOne 本文版权归作者,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接及作者主页链接,否则保留追究法律责任的权利。 ...
2012-02-16 11:14:35
149
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人