4、数据类型与层级的深入解析

数据类型与层级的深入解析

1. 定量数据与定性数据

在数据分析领域,数据通常可分为定量数据和定性数据。当询问数据科学家某类数据的类型时,他们往往会从这两个维度进行判断,这也是描述数据集特征的常见方式。

  • 定量数据 :能用数字描述,且可进行基本数学运算(如加法)的数据。一般来说,定量数据常存在于具有严格行列结构的结构化数据集中,这也凸显了数据预处理步骤的重要性。
  • 定性数据 :无法用数字和基本数学方法描述,通常用自然类别和语言来表达。

下面通过咖啡店数据的例子来具体区分这两种数据类型:
| 特征描述 | 数据类型 | 原因 |
| — | — | — |
| 咖啡店名称 | 定性 | 非数字形式,不能进行数学运算 |
| 收入(千美元) | 定量 | 可用数字描述,可进行加法等运算,如计算年度收入 |
| 邮政编码 | 定性 | 虽用数字表示,但不能进行有意义的数学运算,如相加无实际意义 |
| 月平均顾客数 | 定量 | 可用数字描述,可通过加法计算年度顾客数 |
| 咖啡产地国家 | 定性 | 用名称描述,非数字形式 |

若难以区分数据类型,可通过以下两个问题进行判断:
1. 能否用数字描述该值?若不能,很可能是定性数据;若能,则进入下一个问题。
2. 这些值相加是否有数学意义?若没有,大概率是定性数据;若有,则可能是定量数据。

不同类型的数据能提出的问题也不同:
- 定量数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值