统计学研究中的数据收集与测量
1. 研究目标与数据收集的重要性
在研究过程中,我们会整合一系列的研究发现,最终目标是对世界的某种状态做出一般性的陈述。例如,我们可以得出“有个性障碍的《老大哥》参赛者会高估他人对其个性特征的喜爱程度”这样的结论。
数据收集对于检验理论至关重要。在收集数据时,我们需要决定两件事:一是测量什么,二是如何测量。下面我们先来探讨测量什么的问题。
2. 变量的相关概念
2.1 自变量和因变量
为了检验假设,我们需要测量变量。变量是可以变化的事物,它们可能在不同人之间(如智商、行为)、不同地点(如失业率)甚至不同时间(如情绪、利润、癌细胞数量)有所不同。大多数假设可以用两个变量来表达:一个是假定的原因,另一个是假定的结果。
例如,“可口可乐是一种有效的杀精剂”这一科学陈述中,假定的原因是可口可乐,假定的结果是精子死亡。原因和结果都是变量,对于原因,我们可以改变饮料的类型;对于结果,不同饮料会杀死不同数量的精子。检验这类陈述的关键在于测量这两个变量。
我们认为是原因的变量称为自变量(因为其值不依赖于其他变量),认为是结果的变量称为因变量,因为该变量的值依赖于原因(自变量)。这些术语与实验方法密切相关,在实验中,原因实际上是由实验者操纵的。但在横断面研究中,我们不操纵任何变量,也不能对变量之间的关系做出因果陈述,所以谈论因变量和自变量就没有意义了,因为从某种意义上说,所有变量都是因变量。一种解决办法是放弃因变量和自变量的术语,使用预测变量和结果变量。在实验工作中,原因(自变量)是预测变量,结果(因变量)就是结果变量。这种术语也适用于横断面研究,在横断面研究中,至少从统计学角度,
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



