作者:曹毛毛 R语言中文社区专栏作者 北京协和医学院在读硕士
前言
在本章开始之前请思考几个问题,年龄、体重、性别在统计学中属于同一种数据形式吗?如果不是则分别是哪种?搞清楚数据类型是数据分析的第一步,当然在此之前你已经有了一份已经清洗干净的数据库。
在统计领域内数据可简单以下几类:
计量资料
计数资料
等级资料
根据研究目的还可以将资料进行计量——等级——计数资料转化。不过要记住不能相互转化,只能由高级像低级转化,其实很好理解,因为计数资料信息量较少,转化能力自然较弱。
以人群身高为例,按照某个标准规定160以下为较矮,高于160则为高,这样可以将身高计量资料转化为计数资料高矮。
下面简单的回答一下章节开头的小问题:
年龄和体重如29岁,80kg是可以由一些测量工具准确得到的值,因此为计量资料。
性别不可以用工具测量其值,它是一种类别,反映事物的某种属性,因此是分类资料也可称为计数资料。
在调查公司员工对经理的满意程度,分为非常满意、满意、一般、不满意四类,这样收集到的数据则是反应某种等级,称为等级资料。相信你也不敢说不满意~

了解基本数据类型后,赶紧开启你的统计之旅吧~本章仅涉及计量资料统计方法应用:
t检验用于判断两个总体均值是否具有差异,来源于正态分布
t检验的应用条件是:样本含量较小且满