
统计学
weixin_42797282
这个作者很懒,什么都没留下…
展开
-
时间序列实践
目标是预测未来三期传统汽车的销量。数据背景:03年到19年第一季度分季度的数据,13年之前只有传统汽车的销量,13年之后是传统汽车+新能源汽车的销量,需要预测未来三期传统汽车的销量~ps:传统汽车的销量会受到新能源汽车的影响噢~链接:https://pan.baidu.com/s/1mvbBtA6MybvBj6PTE1kNbA提取码:916t这周的作业不太会用Python做参考了一些...原创 2020-03-07 22:57:08 · 393 阅读 · 0 评论 -
方差分析实战
数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:1、每个地区间的销售量是否相同?2、不同月份的销售量是否相同?3、不同时间与地区的销售量是否相同?每个地区间的销售量是否相同H0:μA=μB=μC=μDH1:四个地区的销量均值不完全相等import pandas as pdfrom statsmodels.formula.ap...原创 2020-03-01 19:09:18 · 262 阅读 · 0 评论 -
时间序列分析
基本概念时间序列是同一现象在不同时间的相继观察值排列而成的序列。经济数据大多数以时间序列的形式给多。根据观察时间的不同,时间序列中的时间可以是年份,季度,月份或者其他形式。时间序列可以分为平稳序列和非平稳序列两大类。平稳序列平稳序列是基本上不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,波动可以看成是随机的。非平稳序...原创 2020-03-01 11:53:48 · 4813 阅读 · 0 评论 -
回归分析实战
import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn import linear_model# 加载数据集data = pd.read_csv('C:\\Users\\x...原创 2020-02-16 21:49:29 · 271 阅读 · 0 评论 -
方差分析
基本概念方差分析听起来以为是检验方差的,但实际上是检验多个总体均值是否相等的统计方法,只是在检验的过程当中运用到了方差。方差分析本质上是研究分类型自变量对数值型因变量的影响。比如,变量之间有没有关系,关系的强度如何等等。因子、水平在方差分析中,所要检验的对象叫做因素或者因子,因素的不同表现称为水平或者处理,在每个因子水平下得到的样本数据称为观测值。比如要分析行业与行业之间的服务质量(以被投...原创 2020-02-12 17:31:11 · 2221 阅读 · 0 评论 -
假设检验实践
1、人体体温的总体均值是否为98.6华氏度?2、人体的温度是否服从正态分布?3、人体体温中存在的异常数据是哪些?4、男女体温是否存在明显差异?5、体温与心率间的相关性(强?弱?中等?)数据源:https://pan.baidu.com/s/1mcq3d1V9bqzNftcseLEqbQ1、import numpy as npfrom scipy import statsimpor...原创 2020-01-19 22:48:21 · 296 阅读 · 0 评论 -
回归分析
一元线性回归相关关系人们在实践中发现,变量之间的关系可以分为两类,一个是函数关系,另一个是相关关系。函数关系、是人们比较熟悉的、设有x和y两个变量,变量y随着x一起变化,并完全依赖于x,当x取某个数值,y根据函数关系取得对应的值,x叫做自变量,y叫做因变量。相关关系、在实际生活中,两个变量之间的关系往往不那么简单,变量之间就不存在完全确定的关系,由于影响一个变量的因素非常多,变量之间的关...原创 2020-01-19 17:18:05 · 1240 阅读 · 0 评论 -
假设检验
基本概念参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是利用样本的统计量去估计总体参数,总体参数在估计前都是位未知的。而假设检验则是对总体参数的值提出一个假设,然后利用样本的信息去检验这个信息是否正确。原假设与备择假设原假设和备择假设是一个完备的事件组,而且在一项假设检验中,原假设和背着假设有且只有一个城里先确定备择假设H1...原创 2019-12-31 17:27:03 · 578 阅读 · 0 评论 -
python参数估计实战
介绍本次实战仅仅以总体均值的区间估计做为例子代码在这里插入代码import pandas as pdimport numpy as npfrom scipy import statsimport mathimport seaborn as snsfrom matplotlib import pyplot as pltplt.rcParams['font.sans-serif...原创 2019-12-26 17:43:08 · 295 阅读 · 0 评论 -
参数估计
参数估计我们在对某总体进行统计描述的时候,通常情况我们因为各种原因(比如总体数量太多,测量成本,时间等)无法对总体中每个个体都进行测量。我需要对总体进行抽样测量,利用样本的信息去估计总体的信息,参数估计就是用样本的统计量去估计总体的估计量,在参数估计中我们把样本的统计量叫做估计量。点估计点估计就是用样本的某个统计量直接做为总体参数的估计值,比如样本均值X拔做为总体均值μ的估计值,样本比例p...原创 2019-12-24 15:38:51 · 1241 阅读 · 0 评论 -
可视化之旅(五)常用图表对比
实践Q:序号 数据分析需求 图表选择1 想了解一下全部发货物品的单价的分布情况,每10元作为一个区间? 2 展示销售额TOP5的产品二级大类? 3 按月份展示商品的销售数量趋势? 4 展示不同年份的商品的销售数量,及其不同年份三种运输方式的数量占比?A:1234.14.2...原创 2019-12-15 23:00:54 · 183 阅读 · 0 评论 -
泰坦尼克号的秘密(数据集分布验证)
描述数据集:https://pan.baidu.com/s/1rvxlWe4LzlHx5td7zYGTTg 提取码: us2a 数据集中包含四列分别为【ID、年龄、价格、港口】Q1:按照港口分类,使用Python求出各类数据年龄和价格的统计量Q2:画出数据集中价格的分布图,验证数据服从哪种分布(卡方?正态?T分布?)Q3:按照港口分类,验证S港与Q港两个港口之间的平均价格之差是否服从...原创 2019-08-31 09:57:57 · 321 阅读 · 0 评论 -
抽样分布(六)
总体与个体在一个统计问题中,研究对象的全体叫做总体,构成总体的每个成员称为个体,总体就是一个分布,其数量指标就是服从该分布的随机变量。常用统计量统计量是样本的函数,它不依赖任何未知的参数。假设(X1,X2,X3,X4,…,Xn)是来自总体的容量为n的样本,f(X1,X2,X3,X4,…,Xn)是样本的函数,且样本函数中不含有任何未知的参数,那么f(X1,X2,X3,X4,…,Xn)就是一...原创 2019-12-08 09:57:23 · 1336 阅读 · 0 评论 -
概率分布实践
二项分布data_binom = binom.rvs(n=5,p=0.75, size=1000)ax = sn.distplot(data_binom, hist=False, kde=True,rug=True, color='blue', hist...原创 2019-12-01 16:13:02 · 199 阅读 · 0 评论 -
概率分布
基本个概念随机变量在说随机变量之前。先说一下什么叫试验和时间,试验就是在同一组条件下,对某事物或现象所进行的观察,把观察的结果叫做事件。随机事件。在同一组条件下,每次试验可能也不能出现的事件必然事件。在同一组条件下,每次试验一定出现的事件不可能事件。在同一组条件下,每次试验一定不出现的事件在实际问题中有的随机事件本身就是数量表示,有的结果却不行,比如掷骰子,试验结果有6个,可以记为1...原创 2019-11-27 09:56:01 · 445 阅读 · 0 评论 -
描述性统计实践
本次实践的数据下载地址:https://pan.baidu.com/s/1lXAnyvSoti-U44MU2fubgw本次实践是在jupyter的集成环境下进行的。实践数据是个中等偏度数据分布,峰度也比3(正态分布的峰度)小很多分图形较为扁平分布图形...原创 2019-11-12 17:20:21 · 368 阅读 · 0 评论