
自然语言处理
速读法啊速度
这个作者很懒,什么都没留下…
展开
-
Mallet:自然语言处理工具包
转自:http://www.131x.com/zhaosq/BBSShow.aspx?id=1727Mallet:自然语言处理工具包ClickNum:157|ReplyNum:1MALLET是基于java的自然语言处理工具箱,包括分档得分类、句类、主题模型、信息抽取等其他机器学习在文本方面的应用,虽然是文本的应用,但是完全可以拿到多媒体方面来,例如机器视觉。转载 2012-05-30 15:13:29 · 1946 阅读 · 0 评论 -
lucene计算文本相似度算法
转自:http://www.131x.com/zhaosq/BBSShow.aspx?id=1736lucene计算文本相似度算法ClickNum:77|ReplyNum:0 Leveraging term vectors 所谓term vector, 就是对于documents的某一field,如title,body这种文本类转载 2012-05-30 15:17:18 · 1670 阅读 · 0 评论 -
词干提取算法Porter Stemming Algorithm解读
转自:http://www.131x.com/zhaosq/BBSShow.aspx?id=1720词干提取算法Porter Stemming Algorithm解读ClickNum:199|ReplyNum:2 Lucene里面的分词器里面有一个PorterStemFilter类,里就用到了著名的词干提取算法。所谓Stemming,就是词干,在英语中单词转载 2012-05-30 15:20:55 · 2604 阅读 · 1 评论 -
文本分类入门
转自:http://blog.youkuaiyun.com/yangliuy/article/details/7316494最近要做文本分类相关的课程project,因此上网找了一下文本分类的资料,下面这个感觉比较通俗易懂,收录在这里。来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All文本分类入 门转载 2012-06-04 17:37:15 · 907 阅读 · 0 评论