- 博客(3)
- 收藏
- 关注
原创 NLP-大白话讲解 TF-IDF算法关键词提取
TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。(这句话看不懂没关系,看下面这句)例如,有两篇不同的文档,一篇是讲解人工智能,另一篇讲解美食。那么这个词就会在第一篇文档中高频出现,而在第二篇文档中几乎不会出现,则认为它对这篇文章来说很重要。反之,“的”、“一个”这种几乎在每篇文章中都会出现的词,虽然其频数高,但是不具有类别区分能力,认为其不是关键词。
2025-03-26 19:26:04
325
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人