基于锚点的模糊粗糙特征选择与织物光依赖分析
1. 基于锚点的模糊粗糙特征选择实验
在文本分类等领域,特征选择是一项关键任务。这里介绍一种基于锚点的模糊粗糙特征选择方法(ABFRFS),并通过实验验证其有效性。
- 实验数据集
- TDT2语料库 :包含11201篇主题相关文档,分为96个类别。实验选取了属于最大30个类别的9394篇文档,去除了出现在两个或更多类别中的文档。
- Reuters - 21578语料库 :有21578篇文档,分为135个类别。实验考虑了65个类别中的8293篇文档,排除了多类别文档。
- 20个新闻组(NGs)语料库 :大约有20000篇文档,分为20个类别。从每个组中选取1000篇文档,去除少量属于多个类别的文档后,剩余18846篇文档。
- 评估指标
- 准确率(Accuracy) :定义为$Accuracy=\frac{TP + TN}{TP + TN + FP + FN}$,其中$TP$、$FP$、$TN$和$FN$分别是真阳性、假阳性、真阴性和假阴性的数量。
- 归一化互信息(NMI) :$ \overline{MI}=\frac{MI(C, C’)}{\max(H(C), H(C’))}$,其中$C$和$C’$分别表示从真实标签和聚类后标签得到的聚类集合,$H(C)$和$H(C’)$分别是$C$和$C’$的熵,$MI(C, C’)=\sum_{c_
超级会员免费看
订阅专栏 解锁全文
759

被折叠的 条评论
为什么被折叠?



