犬类数据特征类型分析与可视化
1. 数据特征类型梳理
在对变量值与代码手册中的描述进行双重检查后,我们可以扩充数据字典,以包含有关特征类型的额外信息。以下是修订后的犬类品种代码手册:
| 特征 | 描述 | 特征类型 | 存储类型 |
| — | — | — | — |
| breed | 犬类品种,如边境牧羊犬、达尔马提亚犬、维兹拉犬 | 主键 | 字符串 |
| group | 美国养犬俱乐部(AKC)分组(畜牧犬、猎犬、非运动犬、运动犬、梗犬、玩具犬、工作犬) | 定性 - 名义 | 字符串 |
| score | AKC 评分 | 定量 | 浮点型 |
| longevity | 典型寿命(年) | 定量 | 浮点型 |
| ailments | 严重遗传疾病数量(0, 1, …, 9) | 定量 - 离散 | 浮点型 |
| purchase_price | 来自 puppyond.com 的平均购买价格 | 定量 | 浮点型 |
| grooming | 梳理频率:1 = 每天,2 = 每周,3 = 每几周 | 定性 - 有序 | 浮点型 |
| children | 对儿童的适宜性:1 = 高,2 = 中等,3 = 低 | 定性 - 有序 | 浮点型 |
| size | 体型:小、中、大 | 定性 - 有序 | 字符串 |
| weight | 典型体重(千克) | 定量 | 浮点型 |
| height | 肩部典型高度(厘米) | 定量 | 浮点型 |
| repetition | 理解新命令所需的重复次数:<5, 5–15, 15–25, 25–40,
超级会员免费看
订阅专栏 解锁全文
1171

被折叠的 条评论
为什么被折叠?



