
TF-IDF
文章平均质量分 76
凌风探梅
这个作者很懒,什么都没留下…
展开
-
TF-IDF与余弦相似性的应用(一):自动提取关键词
http://www.ruanyifeng.com/blog/2013/03/tf-idf.html作者: 阮一峰日期: 2013年3月15日这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?转载 2015-03-13 14:41:52 · 1253 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(二):找出相似文章
FROM:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html作者: 阮一峰日期: 2013年3月21日上一次,我用TF-IDF算法自动提取关键词。今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似转载 2015-03-13 14:44:08 · 1286 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(三):自动摘要
FROM: http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html作者: 阮一峰日期: 2013年3月26日有时候,很简单的数学方法,就可以完成很复杂的任务。这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行转载 2015-03-13 14:44:43 · 1107 阅读 · 0 评论