20、专业调查分析与复杂调查解析

专业调查分析与复杂设计解析

专业调查分析与复杂调查解析

1. 专业调查分析之文本分析

在各类调查问卷中,逐字回答是常见特征。以多伦多市议会关于是否允许新建赌场及选址的调查为例,发放了“赌场反馈表”,收集到 17,780 份回复,最终样本量为 17,766 份(14 份记录因未知原因删除)。调查使用了两个问题:一是用 5 点李克特量表表明对在多伦多新建赌场的感受;二是询问给出该评分的主要原因(逐字回答)。

  • 数据处理
    • 处理缺失数据 :逐字问题“Reason”存在大量缺失数据,可使用 Pandas 的 dropna() 方法,代码为 df_casino.dropna(inplace = True) ,其中 df_casino 是 DataFrame 的名称。
    • 数据清理 :在进行文本数据分析前,需清理数据,即去除前导空格和标点符号,分两步进行:
      • 去除空格 :使用 Pandas 的 str 访问器及其方法,如 strip 方法去除前导和尾随空格,代码示例为 df.myString.str.strip( ) str 访问器还有 upper lower replace
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值