1.词频
(摘自阮一峰博客,参见附录参考)
如果某个词很重要,它应该在这篇文章中多次出现。于是,我们进行”词频”(Term Frequency,缩写为TF)统计。考虑到文章有长短之分,为了便于不同文章的比较,进行”词频”标准化。一般分母设置为文章总的词数或者出现最频繁的那个词的出现次数。比如:
TF=某个词在文中出现次数文章中
本文介绍了SLAM中回环检测的词袋模型BOW,探讨了词频统计、普通词袋与视觉词袋的概念,以及如何利用视觉词袋进行回环检测。详细阐述了回环检测中的视觉词向量数据库和图像比较与度量方法,包括逆序索引和顺序索引在回环检测中的作用。
(摘自阮一峰博客,参见附录参考)
如果某个词很重要,它应该在这篇文章中多次出现。于是,我们进行”词频”(Term Frequency,缩写为TF)统计。考虑到文章有长短之分,为了便于不同文章的比较,进行”词频”标准化。一般分母设置为文章总的词数或者出现最频繁的那个词的出现次数。比如:
1万+
4236
1015
470
3844
1814
1516