
Research
文章平均质量分 69
MemRay
PhD在读,intereted in NLP、Deep Learning及其他AI问题。这里基本是个收藏夹 :D
展开
-
余弦相似度
原文转自:http://blog.sina.com.cn/s/blog_6164a9e20100ehwr.html 向量空间模型将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn, ωn(d)),其中ti(i=1,2, …,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值, 一般被定义为ti在d中出现频率tfi(d)的函数,即 在信息检索中常用的词条权值计算方法为转载 2012-05-01 23:31:56 · 1797 阅读 · 0 评论 -
余弦相似度
在向量空间模型中,文本泛指各种机器可读的记录。用D(Document)表示,特征项(Term,用t表示)是指出现在文档D中且能够代表该文档内容的基本语言单位,主要是由词或者短语构成,文本可以用特征项集表示为D(T1,T2,…,Tn),其中Tk是特征项,1 其中,W1k、W2k分别表示文本D1和D2第K个特征项的权值,1 在自动归类中,我们可以利用类似的方法来计算待归类文档和某类目的相关度。转载 2012-05-02 02:55:31 · 1763 阅读 · 0 评论 -
ICTCLAS2011 java UnsatisfiedLinkError ICTCLAS2011.ICTCLAS_Init([BI)Z
原文转自:http://hi.baidu.com/%C9%C1%BF%CD%B0%A2%B7%B2%CC%E1/blog/item/c3084489820f278aa4c272f9.html 出现的问题如图上图所示 ICTCLAS_Init Exception in thread "main" java.lang.UnsatisfiedLinkError: ICTCLAS.kev转载 2012-05-14 23:58:41 · 1378 阅读 · 0 评论