数据对象(Data Objects)
-
数据集由数据对象组成
-
一个数据对象代表一个实体(entity)
比如:
销售的数据库:顾客,商品,销售
医疗数据库:患者
大学数据库:学生、老师、课程 -
数据对象又称为样本、实列、数据点或对象
-
数据对象用属性描述
-
数据行对应数据对象;列对应属性
属性(Attr ibutes)
-
属性是一个数据字段,表示数据对象的一个特征。
如customer_ID,name,address -
类型
标称属性(nominal)
其值是一些符号或者事物名称
比如:头发颜色={黑色,棕色,灰色,白色}
二元属性(binary)
是一种标称属性,只有两个状态:0或1
对称的(symmetric):两种状态具有同等价值,携带相同权重
如:性别
非对称的(asymmetric):其状态的结果不是同样重要
如:艾滋病的阳性和阴性结果
对重要的结果用1编码,而另一个用0编码
序数属性(ordinal)
其可能的值之间具有有意义的序或者秩评定(ranking)但相继值之间的差是未知的。
如:成绩={优,良,差}
其中心趋势可以用它的众数和中位数表示,但不能定义均值。
注意:标称、二元和序数属性都是定性的,即只描述对象的特征,不给出实际大小
数值属性(numeric)
区间标度属性(interval-scaled)
比率标度属性(ratio-scaled)
离散属性(discrete Attribute)
具有有限或者无限可数个值。
如:邮编/省份数目具有有限个值,customer_id是无限个数的。
可以用或者不用整数表示
连续