
算法与数学
星海千寻
学习使我快乐,每天进步一点点,夯实基础,足够努力,未来定可期。缓慢而坚持地学习,
花一年的时间蜕变,他日剑指长虹。
展开
-
数学与算法《文档相似性 - 余弦定理》
TF-IDF零:寒暄寒暄昨天看了一天的CNN,结果被深度学习的深度给深深地深刻地深埋了(是叹服了),今天想换换脑子,去综结一下之前学习的《数学之美》里面介绍的算法和数学,下一篇再搞几篇深度学习的学习笔记。手里没机器,慢慢先学习,等我回国了再搞机器。一:深入浅出现在,我有两篇文档,如何计算两篇文档的相似程度的呢?因此,这两句话变成了两个向量,每个元素是词语出现的个数,现在问题就变成了两个向量之间的相似性对比,那么就可以用到余弦定理了。两个向量之间的夹角越小,那么两个向量之间的方向越相近,也相原创 2020-09-28 22:04:36 · 303 阅读 · 0 评论 -
数学与算法《TF-IDF》
TF-IDF零:寒暄寒暄昨天看了一天的CNN,结果被深度学习的深度给深深地深刻地深埋了(是叹服了),今天想换换脑子,去综结一下之前学习的《数学之美》里面介绍的算法和数学,下一篇再搞几篇深度学习的学习笔记。一:TF-IDF简介这个是用来提取文章或者网页关键字的算法,我们每一篇文章或者,都是有核心讨论主题,因此如何提取器关键内容的词汇呢?当然你可以说出非常多的方法,但是这里有个非常简单的数学算法,不用特别复杂和高深即理论,一般的学过高中数学的人都能明白的,就是此文的主题,TF-IDF。它是一种计算词语原创 2020-09-28 21:14:07 · 224 阅读 · 0 评论