NJSR北欧社会研究杂志
www.nordicjsr.net
准确估算:丹麦志愿者比例的估计
乔纳森・赫尔姆森
丹麦UCC大学学院研发部
邮箱:JOHE@ucc.dk
摘要
亚伯拉罕、赫尔姆斯和普雷斯勒(2009年)表明,参与志愿工作的人员更有可能参加调查。受访者中存在这种模式的明显后果是,志愿服务估计值可能出现偏差。以志愿工作为主要主题的调查可能由于志愿者与非志愿者相比对此问题更感兴趣,从而产生更大的偏差。本文利用丹麦的面板数据,研究样本流失作为一种特殊类型的无应答偏差,及其对志愿服务估计值的影响。结果表明,样本流失导致对志愿者所占比例的高估。
关键词 :志愿服务,样本流失,参与,社会期许性
引言
纵向研究中的样本流失可能导致估计值出现偏差(Callegaro & DiSogra, 2008),因此许多研究人员正在探索各种激励措施和属性,以鼓励更多人员参与调查(基特、米勒、科胡特、格罗夫斯和普雷斯勒,2000年;柳、库珀和马拉恩斯,2006年;范英格恩、斯托普和布雷德维尔德,2009年)。如果样本流失并非随机发生,则可能引入偏差,特别是当无应答模式与一个或多个关键变量的结果存在某种关联时,问题尤为严重(另见豪泽,2005年)。本文研究了在丹麦开展志愿服务调查时,志愿服务如何影响潜在受访者的参与意愿,但该结果可能也反映了其他许多依赖调查估计值的欧洲国家所面临的类似障碍,尤其是那些依赖纵向研究的国家。
Abraham、Helms和Presser(2009年)的研究表明,由于调查参与的可能性与从事志愿服务相关,无应答确实对美国志愿服务的估计值造成了偏差。调查参与和志愿服务可能同时发生的原因在于,它们体现了一组相似的个人特质。这两类活动的特点都是愿意投入时间于可能不会立即为参与者带来好处的事情。
有人认为,调查参与与公民义务的概念密切相关(格罗夫斯、辛格和科宁,2000年)。样本流失偏差对志愿服务估计值的影响意味着,由于社会期许偏差(卡南、琼斯、迪金和萨洛蒙,2011年),其他亲社会活动的测量结果可能会被高估。也就是说,如果人员参与了此类活动,他们将更有兴趣参与那些允许他们讲述自身社会参与情况的调查。其结果是,无应答会导致对亲社会活动总体上的高估。
本文的结构如下。首先,回顾了关于调查参与及导致无应答或面板流失的潜在障碍的相关文献。调查参与与公民义务的体现相关,因此有必要检验样本流失是否会影响志愿服务估计值以及调查参与和志愿服务之间的关联程度。其次,讨论了研究问题,即志愿服务如何影响一项关于志愿服务的面板调查中的调查参与,以及反过来样本流失又可能如何扭曲对丹麦志愿服务的估计值。第三,展示了分析设计与结果;通过使用两波次面板调查的数据,分析了样本流失在多大程度上可归因于受访者是否参与志愿服务。最后,总结了样本流失对志愿服务估计值的影响,并详细阐述了其对志愿服务测量和亲社会活动测量带来的后果。
先前研究
本研究的关键因变量涉及是否参与调查第二波的决策。换句话说,主要目的是识别导致样本流失的因素。样本流失可被视为一种无应答,因为样本流失的影响是降低总体应答率。在本研究使用的纵向调查中,流失被定义为从一个波次到下一个波次退出面板的成员所占的百分比。
不参与调查的决定可能由受访者个人特征(例如受访者的性别)或问卷设计(例如问题数量或封面信的个性化程度)所决定。研究表明,在导致样本流失和无应答方面,受访者因素比调查设计因素更具影响力(赫尔格森、沃斯和特平,2002年)。本文关注三类可能导致面板流失的受访者因素。第一是缺乏对调查主题的兴趣(Groves 等,2000)。第二是缺乏亲社会态度,以及认为参与非商业性人口调查很重要这一意识的缺失(夏普和弗兰克尔,1983年)。第三是一般性的知识或能力不足,难以理解并回答访谈中的问题(图兰热,2003年)。下一部分将描述这三个因素如何影响参与调查的决定。
在调查研究中,受访者对调查主题的兴趣是影响其参与调查决定的一个关键因素,这一点已得到充分证实(赫伯林和鲍姆格特纳,1978;希恩和麦克米兰,1999)。调查主题的重要性在调查研究文献中被称为‘主题显著性’(例如,齐尔曼、施密茨、斯科佩克和布洛斯菲尔德,2014)。然而,受访者也可能受到访谈员以及许多其他情境因素的激励(卡姆帕内利和奥米查蒂,1999)。因此,有研究提出,参与调查的决定可被视为一种社区参与形式(考珀、辛格和库尔卡,1998)。这有助于解释为何某些子群体在收到邀请时通常更倾向于参与调查。
有证据表明,填写问卷时的公民义务意识是比人们空闲时间多少更能有效预测调查参与的因素(帕科宁,1998年)。Voogt和Saris(2003)指出,公民义务意识以及对本地社区的归属感,可能会提高参与调查的可能性。因此,志愿者更可能表现出更强的公民义务感,因为他们对志愿服务这一主题本身具有内在兴趣。
这一论点支持了志愿服务与调查参与之间存在关联的观点。如果亲社会态度对调查参与至关重要,则在缺乏补偿性研究设计的情况下,对公民参与(如志愿服务)的估计值可能存在严重偏差。此外,社会期许性可能解释了志愿服务、调查参与和公民义务意识三者同时出现的现象。这可能导致对公民参与的高估,且这种高估会随着应答率的下降而加剧(威尔逊,2012)。
亚伯拉罕、梅特兰和比安奇(2006)表明,使用权重可改善志愿服务以及日常活动(如家务劳动)的测量,尽管效果较为有限。此类权重可在比较受访者与非受访者或目标总体时,考虑受访者的人口统计学特征。应注意的是,性别已被确定为面板流失研究中的一个相关因素,因为男性比女性更容易发生流失(乌里格,2008年)。这一发现与以往关于男女在无应答差异方面的研究结果一致(例如,萨克斯、吉尔马丁和布莱恩特,2003年)。
样本流失的另一个原因可能是无法理解并回答调查中的问题。如果这种不理解与回答调查问题的倾向相关,则可能产生偏差。在此背景下,作为障碍的“不理解”并非指智力,而是指接受请求并完成调查访谈所需的能力和自信心。因此,个人不参与调查的原因之一可能是沟通困难(约翰逊、奥鲁尔克、伯里斯和欧文斯,2002年)。这在一定程度上解释了为何拥有更多资源(如教育成就和足够的理解力)的人员更有可能既成为志愿者又参与调查(例如,亚伯拉罕、赫尔姆斯和普雷斯勒,2009年;弗里泽,2006年;威尔逊,2000年)。
研究问题
亚伯拉罕等人(2009)指出,低回应率可能导致了对志愿服务率的高估。换句话说,无应答偏差可能会使志愿服务估计值出现正向偏倚。志愿服务与资源和社会网络的拥有相关(参见威尔逊,2012;威尔逊和马西克,1997),这会使偏差的影响更为显著。这也可能意味着,其他反映亲社会态度和个人资源拥有的活动同样会被高估。
因此,有理由假设志愿服务与调查参与相关。志愿服务还与拥有某些物品相关。由于沟通困难导致的样本流失可能会高估从事志愿工作的人员比例。样本流失还可能导致低估不理解与志愿服务之间关联的重要性,这是由于面板中的自我选择可能影响较低能力人员的代表性。
基于以往关于调查参与和志愿服务的研究,本文的研究问题表述如下:志愿服务如何影响关注志愿工作的调查中的样本流失?
这个问题源于亚伯拉罕等人(2009)的研究。本文试图检验在欧洲国家丹麦,志愿服务与样本流失之间是否存在关联。如果发现两者存在关联,则意味着志愿服务估计值将出现偏差。因此,本文旨在确定此类偏差对志愿服务估计值的重要性。
数据与变量
齐尔曼等人(2014)确定了两种常见的方法来研究受访者兴趣对调查主题的影响如何影响调查估计。一种方法是在随机试验中进行包含实验组和对照组的经典实验研究。刺激可以是在受控环境中不同的调查项目呈现方式或内容。这些实验具有明显的优势,即能够避免选择偏差。然而,在得出结论时应保持谨慎,因为此类实验的外部效度各不相同(巴拉巴斯和杰里特,2010)。
另一种方法是使用面板数据。面板数据使研究人员能够确定顺序问题,因为所有数据是在不同时间收集的。因此,可以追踪同一受访者随时间的变化。这种方法的缺点是难以确定可能影响参与决定的每个刺激因素的因果影响。
本研究使用面板数据来考察潜在的偏差。数据来源于一项丹麦双波次人口调查,该调查分别于2004年和2012年进行,均聚焦于丹麦的志愿服务、慈善捐赠和非正式帮助。调查的主要目的是描绘这些活动在丹麦的开展程度,并追踪多年来的可能变化。这些调查构成了关于丹麦公民社会构成的大规模研究合作项目的实证基础。调查由丹麦国家社会研究中心负责收集回应。问卷由奥尔堡大学、罗斯基勒大学和南丹麦大学的研究人员共同开发。2004年调查采用简单随机抽样方式选取受访者,旨在代表丹麦成年群体。2012年的调查设计为一项面板研究,涵盖此前调查中年龄低于86岁的所有受访者。此外,还进行了补充样本调查,以确保有足够的受访者数量。抽样框基于行政记录构建,能够全面覆盖丹麦人口。两次调查的应答率分别为75%(第一波)和71%(第二波)。因此,从初始调查到第二次调查的面板研究总体应答率为53%。2012年收集的补充样本的应答率为59%(弗里德伯格,2014c)。在两次调查中,大多数通过电话进行访谈。对于无法联系的情况,由访员亲自上门访问。分析基于2004年调查中2,511名受访者的回答。实证模型包含受访者因素、两个人口统计控制变量和一个因变量。
表1 - 因变量和自变量的描述性统计
| 变量 | n | Mean | 标准差 | Min | Max |
|---|---|---|---|---|---|
| 流失 | 2511 | 0.331 | 0.471 | 0 | 1 |
| 志愿者 | 2511 | 0.368 | 0.483 | 0 | 1 |
| 不理解 | 2511 | 0.096 | 0.295 | 0 | 1 |
| 受教育年限 | 2511 | 10.435 | 2.116 | 6 | 15 |
| 关联中的信任 | 2511 | 0.831 | 0.375 | 0 | 1 |
| 义务 | 2511 | 1.330 | 0.897 | 0 | 2 |
| 政治兴趣 | 2511 | 1.714 | 0.842 | 0 | 3 |
| Male | 2511 | 0.483 | 0.500 | 0 | 1 |
| Age | 2511 | 45.023 | 14.816 | 16 | 76 |
本研究的因变量是样本流失。这是一个简单的二分变量,用于表示参加2004年调查的受访者是否参与了2012年的后续波次调查。遗憾的是,即使建立了联系,受访者在2012年拒绝参与调查的各种原因也未与个体受访者进行匹配。因此,分析所用的受访者因素均来自2004年调查。
首先,主要的自变量是受访者在2004年是否参与了志愿服务。受访者被问及他们在过去12个月内是否进行过志愿服务。总体而言,36.8%的受访者报告称他们在过去12个月内积极参与了志愿工作。如上表1所示,流失率为33%,因此2004年的受访者中约有67%也参加了2012年的调查。该流失率比仅关注面板研究中第二波总体应答率时预期的高出4个百分点。这主要是由于对未回答所有访谈问题的受访者进行了成列删除。也就是说,67%的完成率仅包含那些完成了整个访谈的受访者。为了判断完成率是否令人满意,必须考虑先验选择——即只有在2004年参与过的人员才有资格进入该面板(另见Schoeni, Stafford, Mcgonagle, & Andreski, 2013)。总体而言,19.6%的人拒绝参加第二波调查,其余非受访者则因生病、无法联系或搬迁至未知地址而未能参与(Fridberg, 2014a)。由于数据限制,在分析中无法区分不同类型的流失来源。
其次,一组变量测量了受访者的亲社会态度。其中一个问题是询问受访者是否觉得自己有道德义务向慈善机构捐款。回答被编码为三类:“同意”,“既不同意也不反对”和“不同意”。由于这三个类别分别被赋值为0、1和2,均值1.3表明,对于涉及道德义务的陈述,表示不同意的人员多于同意的人员(见表1)。另一个问题是询问受访者是否信任志愿组织。该变量是一个虚拟变量,表示受访者是否信任志愿组织或对志愿组织很少/没有信任。表1显示,83%的受访者信任志愿组织。最后一个关于受访者亲社会态度的变量是询问受访者对政治的兴趣程度。该问题采用四点量表,从“毫无兴趣”(赋值为0)到“非常感兴趣”(赋值为3)。如表1所示,政治兴趣的平均得分为1.7。
第三,两个变量用于衡量受访者的理解能力和个人资源。其中一个虚拟变量用于衡量受访者在访谈过程中是否存在理解问题的困难。与其他变量不同,这一问题是访谈员在访谈结束后立即做出的判断。总体而言,有9.6%的受访者被报告存在回答问题的困难。另一个变量衡量受访者完成的受教育年限。平均而言,受访者完成了10.4年的学校教育。该变量未区分高中阶段的任何教育成就。然而,就访谈中对问题的理解而言,几乎没有理由认为完成15年学校教育的人员之间会存在显著差异。
人口统计控制变量包括性别和年龄。表1显示,样本中男性占48.3%,平均年龄为45岁,受访者年龄范围在16至76岁之间(2004年)。
分析
弗里德伯格(2014b)对丹麦的志愿者领域进行了研究。他得出结论:男性志愿者的比例略高于女性,而在所有年龄组中,36至45岁人员参与志愿服务的可能性最高。此外,受过高等教育的人员中参与志愿工作的人数比例高于教育程度较低或无教育背景的人员(弗里德伯格,2014b,第52页)。此外,Qvist(2014年,第181页)指出,语言障碍是移民参与志愿工作的程度低于其他人口群体的主要原因之一。总体而言,近年来丹麦的志愿服务水平相对稳定(弗里德伯格,2014c)。
采用逻辑回归模型来确定受访者因素对样本流失的影响。逻辑回归模型的结果如表2所示。该表包含回归系数(对数几率)及其稳健标准误。在模型中,引入了年龄变量的平方项以允许存在非线性关联。此外,表2还包含各因变量每增加一个单位时样本流失发生比的百分比变化。在解释系数和发生比的百分比变化时,应考虑由星号表示的统计显著性。为了检验模型设定是否正确,进行了正式检验,即检验预测变量的平方项是否具有显著性。该检验得到的p值为.41。因此,该检验未发现模型存在任何问题或设定错误。
表2 - 面板流失的逻辑回归
| X增加量 | 对流失几率 (稳健标准误) | 发生比变化百分比 |
|---|---|---|
| 志愿者(参考:非志愿者) | -0.268** (0.094) | -23.5% |
| 自愿组织中的信任 (ref. No 信任) | -0.054 (0.116) | -5.2% |
|
道德义务:
既不同意也不反对 (参考:同意) | -0.210 (0.170) | -19.0% |
|
政治兴趣:
兴趣较小(ref. no interest) | -0.065 (0.164) | -6.3% |
| 不理解(参见理解能力) | 0.142 (0.145) | 15.3% |
| 受教育年限 | -0.074** (0.025) | -7.1% |
| Male | 0.334*** (0.091) | 39.6% |
| Age | -0.087*** (0.018) | -8.3% |
| 年龄平方 | 0.001*** (0.000) | 0.1% |
| 常数项 | 1.897*** (0.519) | — |
| 观测值 | 2,511 | |
|
*** p < 0.001,** p < 0.01,* p < 0.05
对数似然:-1594.096。McFadden 伪 R²:0.04。整体模型拟合:p < 0.001,样本量 = 2,511。 |
表2显示了逻辑回归模型的结果。最重要的是,结果证实志愿服务与样本流失呈负相关。该关联具有统计显著性(p < 0.01)。2004年的志愿服务使人员在2012年退出调查的概率降低了23.5%。这一发现表明,由于流失率的存在,丹麦的志愿服务估计值也可能出现偏差。换句话说,参与志愿工作的人员更有可能参与有关志愿工作的调查。
关于受访者的亲社会态度,结果表明这些因素对样本流失的影响可能较小。受访者对志愿组织的信任程度以及将慈善捐赠视为道德义务的问题均无统计显著性。较高的政治兴趣会降低退出样本组的可能性。与对政治‘无兴趣’的受访者相比,在研究期间表示自己‘somewhat’或‘very’对政治感兴趣的受访者,其流失概率分别降低了39.9%和33.0%。
衡量理解能力和调查参与个人资源的变量结果显示,受教育年限是流失率的显著预测因子(p < 0.01)。每增加一年教育,流失的几率降低7.1%。另一方面,理解问题的困难(例如由于语言问题)并不是一个显著的预测因子。这一发现部分可解释为模型已控制了受教育年限,且存在相对较少的受访者群体据报告,部分人员在理解访谈问题方面存在困难。此外,一些可能难以完成访谈的人员可能选择不参加2004年的首次调查,因此他们不会被邀请参加2012年的第二次调查。
两个人口统计控制变量均显著。根据Lugtig(2014)的研究结果,男性更可能退出调查。此外,在丹麦更有可能参与志愿工作的中年人(弗里德伯格,2014b),参与调查的倾向也更高。男性的流失率明显高于女性(p < 0.001)。男性退出样本组的几率高出39.6%。年龄变量以线性形式和平方项形式同时纳入模型。年龄的负系数与年龄平方的正系数表明,流失率在最年轻和最年长的群体中最高。因此,样本流失与年龄的关系呈U型,且流失与年龄之间的关联显著(p < 0.001)。
图1说明了志愿服务对样本流失概率的影响。正如回归分析所示,其他因素也会影响样本流失。因此,该图展示了男性和女性的流失率如何随受教育年限的不同而变化(已添加95%置信区间以显示统计不确定性)。图1中的估计值包含了与回归分析相同的自变量。
图1显示了志愿者与非志愿者在样本流失方面的差异。与非志愿者相比,志愿者更有可能参与第二波调查。此外,图1表明这种差异可能相当显著。女性以及受教育年限较长的人员流失率较低。为了评估样本流失如何影响志愿服务估计值,分别考察志愿者和非志愿者的整体样本流失概率是很有帮助的。志愿者的整体样本流失概率为29.5%,非志愿者为35.1%。在控制其他自变量的情况下,志愿者的百分点差异为5.6,且具有统计显著性(p = 0.004)。
由于面板样本流失导致的无应答偏差可能在每一后续波次中增加,从而造成更大的偏差。主题显著性可能会加剧样本流失,因为受访者对前一波调查中的问题较为熟悉。因此,首次调查的经历可能会影响受访者参与后续调查的决定,尽管是否参与还受到许多其他因素的影响。本研究无法确定这一效应在多大程度上发挥作用。然而,两次调查之间的八年间隔很可能降低了受访者对上次访谈的记忆。
有必要在未来几波关于志愿服务的人口调查中继续采用面板设计,以检验样本流失是否会因非志愿者退出而导致无应答偏差加剧。然而,估算样本流失所造成潜在偏差的一个简单方法是将2012年面板中的志愿者比例与同年收集的补充样本中的比例进行比较。在面板样本中,有39%的受访者报告在过去一年中参与了志愿服务,而在补充样本中这一比例为29%。这表明样本流失很可能导致总体估计出现偏差。如果仅依赖面板数据而不考虑样本流失,则志愿者的比例似乎被高估了。
正如本研究结果所示,若在估计总体志愿者比率时控制人口统计学特征,可减少这种偏差。但完全消除偏差的可能性较小,因为流失取决于一些难以测量的因素。例如,受访者在前一波是否参与志愿服务并不能全面反映主题显著性。由样本流失引起的无应答偏差可能与其他类型的无应答来源(例如第一波调查期间产生的无应答)有所不同。可以合理假设,在首次调查时拒绝参与的人群中,志愿者比例会低于调查受访者,这一点在比较2012年面板研究和补充样本时已有所体现。
因此,本分析中讨论的无应答偏差仅是对整体无应答偏差的部分考察。与主题显著性相关的偏差以及在2004年首次调查前决定是否参与的问题都值得考虑,尤其是近年来许多研究人员面临应答率持续下降的问题(佩切夫,2013年)。2012年补充调查的应答率低于2004年调查,便是这一趋势的例证。因此,若仅仅关注样本流失作为偏差来源,很可能会忽略影响志愿服务率汇总估计的诸多方面。
总结与启示
样本流失是一种特定类型的无应答,指的是人员已经参与过同一主题的前期调查。因此,在调查的第一波中,最不情愿的人员可能已经拒绝了邀请。然而,与样本流失相关的问题与其他无应答来源的挑战类似。如果无应答在某种程度上与研究的关键变量相关,则会产生偏差。
本文的研究问题涉及志愿服务对面板样本流失的影响。结果表明,参与志愿服务的人员比未参与志愿服务的人员更有可能留在面板中。这一差异具有统计显著性,且该发现与亚伯拉罕等人(2009)的研究一致。
此外,参与调查的倾向受到政治兴趣的影响,这表明在识别无应答偏差时,需要考虑的变量不仅限于人口统计变量。
分析结果表明,对丹麦志愿服务的估计值可能存在偏差。样本流失导致了对志愿服务率的高估。尽管通过控制人口统计学特征(如教育和性别)可以在一定程度上解释由样本流失引起的偏差,但无法完全消除。本文的研究结果与其他类似的实证研究一致,因此有理由相信,其他欧洲国家的志愿服务估计值也可能存在无应答偏差。此外,志愿服务的测量与亲社会活动及其他公民参与的测量密切相关。
格罗夫斯、普雷斯和迪普科(2004)进行的一项研究表明,主题兴趣如何影响涵盖教育、儿童保育和投票等多样化领域的调查中的调查参与。他们的研究显示,与其它主题相比,受访者对可能感兴趣的主题的配合概率大约高出40%(Groves et al., 2004, p. 25)。这些结果表明,任何针对特定子群体(例如志愿者)更关注主题的调查,都可能面临类似的无应答偏差问题,从而影响对亲社会活动或态度的估计值。在大多数情况下,这种偏差会导致对参与亲社会活动人员比例的高估,因为他们对该主题更感兴趣,因此更有可能参与相关主题的调查。因此,由于面板流失导致的无应答偏差不仅可能影响志愿工作的估计值,还可能影响其他相关亲社会活动的估计值。本文表明,在面板研究的后续波次中,非志愿者退出的趋势可能会加剧,从而加重有关志愿服务调查中初始的无应答偏差。
63

被折叠的 条评论
为什么被折叠?



