
统计学
文章平均质量分 82
troubleisafriend
这个作者很懒,什么都没留下…
展开
-
第一章 统计学概论
1 统计及其应用领域数据分析所用方法可分为描述统计方法和推断统计方法。 描述统计:研究数据收集、处理、汇总、图标描述、概括与分析等统计方法 推断统计:研究如何利用样本数据来推断总体特征的统计方法2 统计数据的类型按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 分类数据是无序的如男女,企业按行业划分等; 顺序数据是有序的非数字型数据,如一等品,二等品等 按照统计数据原创 2015-08-27 13:39:14 · 983 阅读 · 0 评论 -
第六章 统计量及其抽样分布
1 统计量统计量:由样本构造一个函数,不依赖任何参数 常用统计量:样本均值(X ¯ \bar{X})、样本方差(S 2 S^2)、样本变异系数(V=SX ¯ V=\dfrac{S}{\bar{X}})、样本k阶距、样本k阶中心距、样本偏度、样本峰度 次序统计量:样本极差(最大值减最小值) 充分统计量:统计量加工过程中一点信息都不损失的统计量。判别定理:因子分解定理2 由正态分布导出的几原创 2015-08-29 23:49:31 · 3278 阅读 · 0 评论 -
第五章 随机事件及其概率
1 随机事件及其概率试验、事件 随机事件(偶然事件)、必然事件、不可能事件 概率2 概率的性质与运算法则互斥事件:事件A和时间B不可能同时发生,P(A∪B)=P(A)+P(B) 条件概率与独立事件 全概率公式与贝叶斯公式 贝叶斯公式:逆概率公式3 离散型随机变量及其分布期望 方差:σ²=D(X)=E[X-E(X)]²=E(X²)-[E(X)]² 二项分布:E(X)=np D(X原创 2015-08-27 19:53:45 · 1418 阅读 · 0 评论 -
第九章 列联分析
列联分析主要用于分类数据的分析1 分类数据与列联表1 分类数据如:完整家庭/离异家庭、一等品/二等品、三等品……2 列联表的构造列联表是由两个以上的变量进行交叉分类的频数分布表。3 列联表的分布列联表的分布可以从两个方便来看:一个是观察值的分布;一个是期望值的分布。 (1)观察值 条件频数、行边缘频数、列边缘频数、百分比 (2)期望值分布 根据比例求出的各个变量的期望值 以四个公司对改革方原创 2015-08-31 19:42:09 · 23246 阅读 · 0 评论 -
第七章 参数估计
参数估计是在抽样及抽样分布的基础上,根据样本统计量来推断所关心的总体参数。1 参数估计基本原理1 估计量与估计值 估计量:参数估计中,用来估计总体参数的统计量的名称,如样本均值、样本比例 估计值:根据一个具体的样本计算出来的估计量的数值 2 点估计与区间估计 参数估计的方法有点估计和区间估计。 点估计:用样本统计量的某个取值直接作为总体参数的估计值。无法概率度量可靠程度 区间估计:在点估原创 2015-08-31 11:47:25 · 3241 阅读 · 0 评论 -
第八章 假设检验
参数估计:是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的 假设检验:先对μ \mu的值提出一个假设,然后利用样本信息去检验这个假设是否成立1 假设检验的基本问题1 假设的表达式原假设H0 备选假设H12 两类错误第一类错误:原假设为真却被拒绝,犯这种错误的概率用α表示,所以也称α错误或弃真错误 第二类错误:原假设为伪却没有拒绝,犯这种错误的概率用β表示,也称β错误或取伪错误 对原创 2015-08-31 15:38:33 · 1118 阅读 · 0 评论 -
第十一章 一元线性回归
主要分析数值型自变量与数值型自变量之间的关系。 从变量个数上看,可分为简单相关与简单回归分析和多元相关与多元回归分析;从变量之间的关系形态上看,有线性相关与线性回归分析和非线性相关与非线性回归分析。1 变量间关系的度量1 变量间的关系变量之间的关系可分为函数关系和相关关系 函数关系:一 一对应的确定关系 相关关系:变量之间存在的不确定的数量关系2 相关关系的描述与测度假设:(1)两个变量之间是原创 2015-09-01 16:21:52 · 3905 阅读 · 0 评论 -
第十三章 时间序列分析和预测
时间序列的关键是确定出已有的时间序列的变化模式,并假定这种模式会延续到未来。 时间序列分析就其发展的历史阶段和所使用的统计分析方法来看,有传统的时间序列分析和现代时间序列分析。下文主要介绍传统的时间序列的分析方法,内容包括时间序列数据的统计和预测方法。1 时间序列及其分解时间序列是同一现象在不同时间上的相继观察值排列而成的序列,可以分为平稳序列和非平稳序列。 平稳序列(stationaryser原创 2015-09-01 21:11:32 · 23160 阅读 · 2 评论 -
第十章 方差分析
从形式上看,方差分析是比较多个总体的均值是否相等,但从本质上它所研究的是变量之间的关系。在研究一个(或多个)分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中的主要方法之一。1 方差分析引论随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。而方差分析则是同时考虑所有样本,排除了错误累积的概率,从而避免拒绝一个真实的原假设。1 方差分析及其有关术语方差分原创 2015-08-31 21:39:04 · 4853 阅读 · 0 评论 -
第四章 数据的概括性度量
1 集中趋势的度量分类数据:众数 顺序数据:中位数和分位数 分位数:上四分位数(Ql)、下四分位数(Qu) Ql位置=n/4,Qu位置=3n/4 如果位置是整数,四分位数就是在该位置对应的值;如果是在0.5的位置上,则取该位置两侧值的平均数;如果在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。 数值型数据:平均数 几何平均数:n个变量值乘积的n原创 2015-08-27 14:16:34 · 2416 阅读 · 0 评论 -
第二章 数据的收集
1 数据的来源数据的间接来源:二手资料 数据的直接来源2 调查数据数据采样阶段:如何抽选出一个好的样本 使用抽样的方式采集数据的具体方式有很多种,可以分为两类:概率抽样和非概率抽样 概率抽样:也称随机抽样。主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样 分层抽样:将抽样样本按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来对总体的目原创 2015-08-27 13:45:06 · 1201 阅读 · 0 评论 -
第三章 数据的图形展示
1 数据的预处理数据审核:检查数据中是否有错误,主要从完整性和准确性两个方面。对二手数据,则着重适用性和时效性。 数据筛选:根据需要找出符合特定条件的某类数据。 数据排序:按一定顺序将数据排列 数据透视表2 品质数据的整理与展示对品质数据主要做分类整理,对数值型数据主要做分组整理。1 分类数据的整理与展示频数与频数分布 分类数据的图示 条形图 帕累托图:按各类别数据出现的频数多少排序后绘原创 2015-08-27 13:49:14 · 1614 阅读 · 0 评论 -
第十二章 多元线性回归
1 多元线性回归模型1 多元回归模型与回归方程多元回归模型: y=β 0 +β 1 x 1 +β 2 x 2 +...+β k x k +ε y=\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_kx_k+\varepsilon 多元回归方程: E(y)=β 0 +β 1 x 1 +β 2 x 2 +...+β k x k E(y)=\beta_0+\beta_原创 2015-09-01 21:06:46 · 3429 阅读 · 0 评论