目录
1 数据格式
假设一份数据有n个个案(横),m个属性(纵),数据格式如下:
| 属性x1 | 属性x2 | ... | 属性xm | |
| id1 | ||||
| id2 | ||||
| ... | ||||
| idn |
用矩阵的形式表示(也称“决策矩阵”):
2 不同属性类型的指标规范化方法
理解:即x1、x2、x3不同属性类型,如x1单位为万元,x2单位为千克,x3单位为万人,这种情况比较多见。
2.1 效益型指标:即该指标越大越好
对某个效益型属性指标,令
或
该方法规范化的结果是将效益型指标转化为(0,1
本文介绍了数据规范化的方法,包括针对不同属性类型的指标规范化,如效益型、成本型、固定型/中间型、区间型、偏离区间型和偏离固定值型,并详细阐述了相同属性类型指标的归一化、最大化和模一化方法,旨在帮助理解和应用数据预处理技术。
目录
假设一份数据有n个个案(横),m个属性(纵),数据格式如下:
| 属性x1 | 属性x2 | ... | 属性xm | |
| id1 | ||||
| id2 | ||||
| ... | ||||
| idn |
用矩阵的形式表示(也称“决策矩阵”):
理解:即x1、x2、x3不同属性类型,如x1单位为万元,x2单位为千克,x3单位为万人,这种情况比较多见。
对某个效益型属性指标,令
或
该方法规范化的结果是将效益型指标转化为(0,1
8203

被折叠的 条评论
为什么被折叠?