今日课程内容
-
内容回顾
-
线性回归
相关分析
一元回归分析
多元回归分析
多重回归分析
内容回顾
数据分析的基本流程
1.加载数据(数据的类型,可能需要修改)
2.数据处理
Excel的数据处理
spss的数据处理
3.数据统计分析:方差、标准差、最大值、最小值、和...
Excel的统计
spss的统计性描述分析
4.可视化
绘制图表
Excel的插入图表
spss的简单图表
后期:学习Tableua可视化工具
5.数据检验
spss的推断统计
python的机器学习
6.数据预测
线性回归
逻辑回归
时间序列
工具:spss、python...
7.写报告
推断统计
概念:利用样本数据推断出总体的参数。
推断统计:
参数估计
假设检验
检验方式:
参数检验
平均值检验
单样本T检验
两独立样本T检验
两配对样本T检验
非参数检验
卡方检验
二项分布检验
游程检验
作业讲解
# 定义函数
def func1(list1, list2):
# 集合的元素特征是不重复
a = set(list1)
b = set(list2)
# 求所有相同元素
res = a & b
# 求所有不同元素
res2 = a ^ b
return res, res2
# 定义列表
c = [1, 2, 3, 4, 5, 6]
d = [3, 4, 5, 6, 7, 8]
# 调用函数
func1(c, d)
print(func1(c, d))
print(func1(c, d)[1])
t = 0
with open(r'F:\func1\cache\b.txt', 'w', encoding='utf8') as f:
f.write('{"t":%s}' % t)
# 定义函数
def func1():
global t # 全局变量t
t += 1
with open(r'F:\func1\cache\b.txt', 'w', encoding='utf8') as f:
f.write('{"t":%s}' % t)
func1()
func1()
func1()
# 读取文件内容
with open(r'F:\func1\cache\b.txt', 'r', encoding='utf8') as f:
res = f.read()
print(res)
回归
目录:
相关分析
回归分析
一元分析
多元分析
逐步分析
非线性回归
相关分析
概念:在做回归分析时,需要知道哪些自变量会对因变量产生影响,所以需要对数据进行相关分析。
自变量:影响结果的变量,称为自变量(可以是多个)
因变量:要研究的对象就叫做因变量(有且只有1个)
变量:
人工变量和虚拟变量
在做分析时,有的变量可以进行度量计算,有的变量不能度量计算(季度,职业等),对它进行
"量化"处理,构造只取"0"或"1"的人工变量,称为虚拟变量。
相关分析的描述:
0相关
负相关
正相关
变量关系:
函数关系
相关关系
因果关系
并生关系
相关系数:可以根据相关系统得出相关的程度
极强相关 0.8~1
强相关 0.6~0.8
中等相关 0.4~0.6
弱相关 0.2~0.4
无关 0~0.2
相关的种类
1.根据自变量的多少划分,可分为单相关和复相关
2.根据相关关系的方向划分,可分为正相关和负相关
3.根据变量间相互关系的表现形式划分,线性相关和非线性相关
4.根据相关关系的程度划分,可分为不相关、完全相关和不完全相关
回归分析
基于相关原则的一种预测方法。
回归的基本分类
哑变量
包含:逻辑回归
不包含:一元、多元回归
线性回归分析的基本步骤
1.明确目标,确定因变量(计算结果)、自变量
2.绘制散点图,建立回归预测模型(线性回归、逻辑回归等)
3.进行相关分析
4.计算预测预测差值
5.计算预测值
一元回归分析
一元就是指只有一个自变量,因此,方程里只有一个X
案例1:广告费用与销售额
案例2:总人数与进店人数
多元回归分析
多元,则表示有多个自变量,方程里会有很多个X,如X1,X2,X3,等等
如:研究促销活动、包装、价格等等多个因素对产品销量的影响,那自变量是包括促销活动、包装、价格,等等,自变量很多
本文介绍了数据分析的基本流程,包括数据加载、处理、统计分析、可视化、检验及预测等内容,并重点讲解了线性回归、逻辑回归及时间序列等预测方法。同时,文章还详细解释了回归分析的概念、步骤及相关性分析。
615

被折叠的 条评论
为什么被折叠?



