提取关键词 从输入语料库中推断特征词。 输入参数 语料库(Corpus):文档集合。 单词表(Words):单词表格。 输出参数 单词表(Words):单词表格。 提取关键词 功能用于从语料库中推断特征词。 关键词提取的评分方法: TF-IDF:通过词频(TF)乘以逆文档频率(IDF)计算得分。若某个词在少数文档中高频出现,则得分较高;若在整个语料库中普遍出现,则得分较低。 YAKE!:一种无监督的先进方法,适用于不同长度的文本。 Rake:一种基于停用词分隔符的无监督领域无关方法。