文本分类与随机信息系统中的属性约简
1. 文本分类的博弈论方法
在处理文本分类问题,尤其是存在高度类别不平衡的情况时,有一种结合博弈论的方法。该方法实现了正类别和负类别两个参与者之间的博弈。参与者会为各自的类别找出特征的效用,并采取适当的行动。这种方法的重要性在于它能够包含指示正类别、负类别或两者的特征。通过示例可以看出,它在涉及高度不平衡的文本分类应用中可能很有用。
1.1 方法步骤
- 确定博弈参与者 :正类别和负类别作为两个参与者。
- 计算特征效用 :参与者为各自类别计算特征的效用。
- 采取行动 :根据特征效用采取适当行动。
2. 随机信息系统与模糊决策中的属性约简
2.1 背景介绍
信息的不精确性和不确定性是信息不完整性的两个重要方面。粗糙集理论可用于研究智能系统中信息的不足和不完整性,其基本概念是由近似空间诱导的一对下近似和上近似。而Dempster - Shafer证据理论则是处理信息系统中不确定性的另一种重要方法,其基本数值度量是由信念结构导出的一对信念和似然函数。
2.2 模糊证据理论
2.2.1 基本定义
设 $U$ 是一个非空有限集,称为论域。$P(U)$ 表示 $U$ 的所有子集的类,$F(U)$ 表示 $U$ 的所有模糊子集的类。
- 概率定义 :若 $X$ 是 $U$ 的