CGSS2015问卷数据STATA重编码命令(部分)

本文介绍了使用CGSS数据进行样本筛选的过程,并详细记录了针对不同变量的数据清洗和编码操作,包括年龄范围限定、政治身份与教育程度的重新编码等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

今天在写论文时处理的CGSS数据,保存下来以待以后用

 

 

选取城市样本

drop if s1==2

选取18-45岁的样本

drop if  a301>1997

drop if  a301<1970

计算年龄

gen nianling=2015-a301

选取父母年龄在40-65岁的样本

drop if a89a>1975

drop if a89a<1950

drop if a90a>1975

drop if a90a<1950

去除子女父母政治身份小于1(包括-8 无法回答,-3 拒绝回答,-2 不知道,-1 不适用)的样本

dropif a10<1

dropif a89c<1

dropif a90c<1

把子女父母政治身份“共青团员”定为“群众”,“其他党派”定为“党员”

replacea10=1 if a10==2

replacea 10=4 if a10==3

replacea 89c=1 if a89c==2

replacea 89c=4 if a89c==3

replacea 90c=1 if a90c==2

replacea 90c=4 if a90c==3

对子女父母的政治身份重新编码(0-群众1-党员)

replace a10=0 if a10==1

replace a10=1 if a10==4

replace a89c =0 if a89c ==1

replace a89c =1 if a89c ==4

replace a90c =0 if a90c ==1

replace a90c =1 if a90c ==4

重新编码父母行政职务(0-无行政职务,1-有行政职务)

replace a89f =0 if a89f<1

replace a89f =1 if a89f>0

replace a90f =0 if a90f<1

replace a90f =1 if a90f>0

重新编码子女、父母的教育程度(1-初中及以下,2-高中到大专,3-本科及以上)

replacea7a=1 if a7a<5

replacea7a=2 ifa7a==5|a7a==6|a7a==7|a7a==8|a7a==9|a7a==10

replacea7a=3 if a7a==11|a7a==12|a7a==13

replacea89b=1 if a89b<5

replacea89b =2 if a89b ==5|a89b ==6|a89b==7|a89b ==8|a89b ==9|a89b ==10

replacea89b =3 if a89b ==11|a89b==12|a89b ==13

replacea90b=1 if a90b<5

replacea90b =2 if a90b ==5|a90b ==6|a90b==7|a90b ==8|a90b ==9|a90b ==10

replacea7a=3 if a90b ==11|a90b ==12|a90b==13 

重新编码婚姻状况(0-未婚,1-已婚)

replace a69=0 if a69<3

replace a69=1 if a69>2

重新编码性别0-女 1-男

replace a2=0 if(a2==2)

处理工龄,将-3 拒绝回答,-2 不知道,-1 不适用,统一划为0

replacea59c=0 if a59c<0

重新编码省份(1-东部,2-中部,3-西部)

recodes41 1 4 12 7 17 15 19 24 10 20=1 11 9 1618 21 22 5 27 31=2  3 13 28 6 26 2 25 2923 30 8 14=3

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值