昨日内容回顾
数据处理
数据的拆分
个案计数
缺失值替换
标识重复值
标识异常值
汇总
加权
重新编码
二分法查询
今日内容详细
-
作业讲解
-
spss-描述性统计
离散程度
分布状态
…
二分法查询
# 输入一串数字
nums = [1,3,23,6,8,45,4,9]
# 对数字进行排序
nums.sort()
print(nums)
# 二分法查询算法
# 定义函数
def search(num):
max = len(nums) - 1
min = 0
mid = (max + min)//2
while num != nums[mid]:
if num > nums[mid]:
print('从中间数往后查')
min = mid + 1
mid = (max + min)//2
else:
print('从中间数往前查')
max = mid - 1
mid = (max + min)//2
if min > max:
print('数据不存在')
return False
return True
res = search(23)
print(res)
描述性统计
统计数据基础概念
数据的离散
数据的分布
...
频数分析
描述性统计
数据分析:描述分析、推断分析、探索分析 (现状、原因、预测)
1.统计数据的基本概念
a.数据类型
分类数据:文字、描述事物的特征
顺序数据:文字、描述事物的特征,但是有顺序(低级、中级、高级)
数值型数据
b.统计量
集中趋势:均值、中位数、众数、四分位数
离散程度:异重比率、四分位差、极差、平均差、方差、标准差
分布描述:峰度、偏度
附加:四分位数据计算平均值
离散程度:
1 5 7 9 10 20
极差:最大值与最小值的差值,19
1 2 3 4 5 平均数:3
平均差:(2+1+0+1+2)/5=1.2
方差:
4 1 0 1 4
(4+1+0+1+4)/5=2
标准差:方差的平方根
分布描述
偏态:偏态系数
小于0,左偏,平均数<众数
大于0,右偏,平均数>众数
峰度:峰度系数
练习
list = ['青海省','内蒙古自治区','西藏自治区','新疆维吾尔自治区','广西壮族自治区']
本文主要介绍了数据处理的基础流程,包括数据拆分、计数、缺失值处理等,并深入探讨了描述性统计分析方法,如离散程度测量、分布状态评估及频数分析等内容。
6470

被折叠的 条评论
为什么被折叠?



