数学之美之TF-IDF算法
By 白熊花田(http://blog.youkuaiyun.com/whiterbear) 转载需注明出处,谢谢。
吴军博士在《数学之美》一书中提到如何使用TF-IDF算法进行确定网页和查询的相关性判断。我在这里给出自己学习的笔记。
相关名称:
TF-IDF(term frequency–inversedocument frequency)是一种用于资讯检索与资讯探勘的常用加权技术。
TF:Term Frequency 词频
本文介绍了TF-IDF算法在信息检索中的应用,解释了词频(TF)和倒文档频率(IDF)的概念,并讨论了如何利用TF-IDF来确定关键词在网页中的权重,以提高搜索结果的相关性。
By 白熊花田(http://blog.youkuaiyun.com/whiterbear) 转载需注明出处,谢谢。
吴军博士在《数学之美》一书中提到如何使用TF-IDF算法进行确定网页和查询的相关性判断。我在这里给出自己学习的笔记。
TF-IDF(term frequency–inversedocument frequency)是一种用于资讯检索与资讯探勘的常用加权技术。
TF:Term Frequency 词频
3183

被折叠的 条评论
为什么被折叠?