知识发现中的属性相关性、离散化及贝叶斯网络在问答领域的应用
1. 属性相关性与离散化
在知识发现过程中,属性相关性和离散化是重要的研究内容。研究人员在作者身份归属任务中进行了大量实验,采用多种排名和离散化方法,以观察特征重要性与表示形式之间的关系,以及其对分类器性能的影响。
实验中使用了贝叶斯网络(Bayesian Network)和随机森林(Random Forest)分类器,进行选择性离散化过程,并记录不同离散化方法下的平均性能和标准差。具体离散化方法包括 dsF、dsK、duf 和 duw,数据集分为 F - writers 和 M - writers。
| 分类器 | 离散化方法 | F - writers (WrapB) | F - writers (Corr) | F - writers (SVM) | M - writers (WrapB) | M - writers (Corr) | M - writers (SVM) |
|---|---|---|---|---|---|---|---|
| 贝叶斯网络 (Cont.domain: 91.60) | dsF | 79.95 ± 16.32 | 74.83 ± 13.94 | 76.74 ± 15.71 | 76.94 ± 03.20 |
超级会员免费看
订阅专栏 解锁全文
3441

被折叠的 条评论
为什么被折叠?



