机器学习基础入门:从数据处理到模型构建
1. 数据测量尺度
数据有不同的测量尺度,理解这些尺度对于数据分析和机器学习至关重要。
- 顺序尺度(Ordinal Scale) :当数据的类别存在顺序关系时,使用顺序尺度进行测量。例如,军衔(Second Lieutenant, First Lieutenant, Captain等)、服装尺码(Small, Medium, Large等)和考试排名(1, 2, 3等)。顺序尺度中,等级之间的差异在方向和权威性上是一致的,但在大小上并不一致。
- 区间尺度(Interval Scale) :如果数值之间的差异具有意义,则数据采用区间尺度进行测量。例如,温度(10, 20, 30等)和智商评级(85 - 114, 115 - 129等)。
- 比率尺度(Ratio Scale) :比率尺度的数据不仅数值差异有意义,还存在真正的零点。这是最常见的测量尺度,如体重(10, 20, 30等)、身高(5, 6, 7等)和年龄(1, 2, 3等)。
| 测量尺度 | 性质 | 数学运算 | 描述性统计 |
|---|---|---|---|
| 名义尺度(Nominal) | 同一性 | 计数 | 众数、比例 |
| 顺序尺度(Ordi |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



