7、调查数据处理:变量创建、缩放与结构认知

调查数据处理:变量创建、缩放与结构认知

1. 创建新变量

在处理调查数据时,创建新变量是常见的操作,以下是几种创建新变量的方式:
- 创建汇总变量
- 二分法处理李克特量表数据 :假设使用10分制李克特量表进行客户满意度调查,“10”表示非常满意,“1”表示非常不满意。可以将其分为两部分,例如将评分为8、9、10的受访者归类为“满意”,其他为“不满意”。可以使用列表推导式来实现这一转换,代码如下:

[ 1 if x >= 8 else 0 for x in df.satisfaction ]
此代码会对DataFrame `df` 中的 `satisfaction` 变量进行迭代处理,将大于等于8的值转换为1,小于8的值转换为0,并将结果存储在新变量 “t3b” 中。
- **从出生年份计算年龄**:在调查中,询问受访者出生年份(YOB)比直接询问年龄更不容易引起反感。若调查在2010年进行,可通过 `2010 - YOB` 计算年龄,并将其添加到DataFrame中。
- **汇总多个变量**:以退伍军人调查为例,受访者需勾选曾服役的军事分支,有陆军、海军、空军、海军陆战队、海岸警卫队和其他六个选项。可以创建新变量来表示服役分支数量,还可创建另一个变量表示若只服役于一个分支则显示该分支名称,若服役于多个分支则显示 “Multiple”。也可使用Pandas的 `sum` 方法对各分支的指示变量求和,计算每个退伍军人的分支数量,代码如下:

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值