数据分析(二)

本文详细介绍了数据科学中的基本概念,包括定性数据与定量数据的区别,分类数据、顺序数据、数值型数据的特性,以及针对不同数据类型的统计分析方法。同时,探讨了数据收集、数据埋点和第三方数据平台的应用,以及数据整理过程中的异常检测与清洗策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据类型

定性数据:一般通过问卷调查获取

  • 分类数据:男女,天气(不能区分大小,运算)
  • 顺序数据:满意度评分,小学,中学,大学(可区分大小)

定量数据:一般通过日志获取

  • 数值型数据离散型:用户数,消费次数(可加减)
  • 数值型数据连续型:成绩,消费金额(可以乘除)

统计方法:

连续型变量:能做频数分析,集中趋势分析(均值,众数,中位数),离散程度分析(标准差,方差,最大值,最小值,范围)

非连续型变量:主要能做频数分析

数据收集:

  • 数据埋点:如UV/PV,用户数,用户停留时间,浏览页面等用户行为数据
  • 第三方的数据平台:如Growing IO,SimilarWeb, Google Analytics,国家统计局网站
  • 问卷调查:线上问卷调查,制作问卷工具;线下问卷调查

数据整理:

  • 数据异常表现:空值,波动太大,不同数据源获取的数据矛盾
  • 数据异常原因:系统故障,人为因素
  • 数据如何清洗:删除异常值,平均值填充,通过统计计算值填充,不同数据源的数据交叉验证
  •  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值