DRSA - ANN分类器性能研究
1 引言
混合人工智能系统在模式识别中应用广泛,因其灵活性可适应不同问题。分类器融合旨在提高质量和正确识别率,还能从不同角度看待问题,特别是在降维方面。
基于规则的分类器依赖规则归纳,而基于连接主义的分类器则通过数据分布和处理实现。将二者融合并分析混合分类器性能,能揭示特定特征在识别中的作用,且这种分析不依赖领域知识,而是基于所采用的技术及其固有属性。
1.1 DRSA方法
基于优势的粗糙集方法(DRSA)是一种基于规则的分类解决方案。它以Z. Pawlak的基本概念为基础,但用优势关系替代了经典版本(CRSA)中的不可分辨关系,这使得它不仅能识别属性的有无,还能处理属性的顺序,从而可以处理连续数值数据。
在DRSA处理中,某些特征可能比其他特征更重要。如果选择相对约简(仍能保持正确分类的属性子集)进行进一步处理,一些特征可以被忽略。决策规则的计算会考虑规则的长度和支持度(规则对学习样本的有效数量)等因素。
1.2 人工神经网络
人工神经网络中的分布式数据和处理构成了连接主义方法。在学习过程中,网络通过调整互连的权重,使网络输出的误差最小化,从而确定特征的重要性。
过去的研究表明,基于粗糙集的分析可以通过观察离散化和实数据的相对约简中条件属性的出现次数,以及实数据决策规则中条件属性的出现次数,来减少ANN分类器的输入数量。本文在此基础上,重点研究决策规则的支持度,将其作为单个属性重要性的指标,并在文本风格分析领域研究混合分类器的性能。
2 文本风格分析与输入数据
文本风格分析是通过定量测量来表达
超级会员免费看
订阅专栏 解锁全文
43

被折叠的 条评论
为什么被折叠?



