特征类型、特性及处理方法解析
在数据分析和机器学习领域,特征的类型、特性以及如何对其进行处理是非常重要的内容。下面将详细介绍不同类型的特征、它们的特性以及相应的处理方法。
1. 特征的类型及特性
特征主要分为三类:定量特征、有序特征和分类特征,还有一种特殊的分类特征——布尔特征。以下是它们的详细介绍:
| 特征类型 | 顺序 | 尺度 | 集中趋势统计量 | 离散程度统计量 | 形状统计量 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| 分类特征 | × | × | 众数 | n/a | n/a |
| 有序特征 | √ | × | 众数、中位数 | 分位数 | n/a |
| 定量特征 | √ | √ | 均值 | 极差、四分位距、方差、标准差 | 偏度、峰度 |
- 定量特征 :具有有意义的数值尺度,通常涉及到实数映射,即使特征映射到实数的子集,如以年为单位表示的年龄,计算均值、标准差等统计量仍需要实数的完整尺度。
- 有序特征 :有顺序但无尺度,其定义域是一个全序集,如字符或字符串集合。例如表示排名顺序的特征(第一、第二、第三等)。有序特征允许使用众数和中位数作为集中趋势统计量,分位数作为离散程度统计量。
- 分类特征 :既无顺序也无尺度,除众数外不允许进行其他统计汇总。布尔特征是分类特征的一种,它映射到真值 true 和 false。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



