模式识别特征选择:前沿方法与挑战
1. 特征选择研究背景
随着科技设备日常需执行机器学习和模式识别任务,特征选择的研究日益增多。应用场景广泛,算法也从处理点状数据向处理时间关联数据发展。本次对特征选择的前沿研究进行综述,旨在寻找研究空白,为应对未来挑战提供思路。
2. 基于统计的特征选择方法
描述性统计通过一些度量来描述数据,如数据类型、离散程度等。这些信息是统计特征选择方法的基础。统计特征选择在不考虑分类算法的情况下比较属性,多数属于过滤式特征选择方法。
2.1 统计度量
- 均值 :是统计学中常用的位置度量,用于定位数据。变量均值计算公式为:
[ \tilde{x} = \frac{\sum_{i=1}^{n} x_i}{n} ] - 方差 :用于衡量变量值的离散程度,即变量值与均值的差异程度。方差公式为:
[ s^2 = \frac{\sum_{i=1}^{n} (x_i - \tilde{x})^2}{n} ] - 标准差 :是方差的平方根,公式为:
[ s = \sqrt{s^2} = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \tilde{x})^2}{n}} ]
标准差越大,变量数据值相对于均值越分散。
2.2 基于统计的特征选择方法前沿
- 时间关联数据特征选择算法(Somuano 2016)
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



