数据分析-spss5.08

本文主要介绍了数据处理的基础流程,包括数据拆分、计数、缺失值处理等,并深入探讨了描述性统计分析方法,如离散程度测量、分布状态评估及频数分析等内容。

昨日内容回顾

数据处理
   数据的拆分
   个案计数
   缺失值替换
   标识重复值
   标识异常值
   汇总
   加权
   重新编码
二分法查询

今日内容详细

  • 作业讲解

  • spss-描述性统计

    离散程度

    分布状态

二分法查询

# 输入一串数字
nums = [1,3,23,6,8,45,4,9]
# 对数字进行排序
nums.sort()
print(nums)
# 二分法查询算法

# 定义函数
def search(num):
    max = len(nums) - 1
    min = 0
    mid = (max + min)//2
    while num != nums[mid]:
        if num > nums[mid]:
            print('从中间数往后查')
            min = mid + 1
            mid = (max + min)//2
        else:
            print('从中间数往前查')
            max = mid - 1
            mid = (max + min)//2
        if min > max:
            print('数据不存在')
            return False
    return True
res = search(23)
print(res)

描述性统计

统计数据基础概念
     数据的离散
     数据的分布
     ...
频数分析
描述性统计


数据分析:描述分析、推断分析、探索分析 (现状、原因、预测)
1.统计数据的基本概念
   a.数据类型
      分类数据:文字、描述事物的特征
      顺序数据:文字、描述事物的特征,但是有顺序(低级、中级、高级)
      数值型数据
   b.统计量
      集中趋势:均值、中位数、众数、四分位数
      离散程度:异重比率、四分位差、极差、平均差、方差、标准差
      分布描述:峰度、偏度
      
  附加:四分位数据计算平均值
离散程度:
    1 5 7 9 10 20
    极差:最大值与最小值的差值,19

    1 2 3 4 5  平均数:3
    平均差:(2+1+0+1+2)/5=1.2
    方差:
       4 1 0 1 4
        (4+1+0+1+4)/5=2
    标准差:方差的平方根
    
分布描述
   偏态:偏态系数
     小于0,左偏,平均数<众数
     大于0,右偏,平均数>众数
   峰度:峰度系数

练习


    list = ['青海省','内蒙古自治区','西藏自治区','新疆维吾尔自治区','广西壮族自治区']




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值