
统计学学习日记
文章平均质量分 58
惜玉冰
这个作者很懒,什么都没留下…
展开
-
统计学学习日记:L10-假设检验p值
一、什么是p值在假设检验中,证明备择假设H₁存在困难,我们就去证明它的反面原假设H0。P值实际上是当H0假设为真,一些极端情况出现的概率,如果P值很小,说明这种情况发生的概率很小。如果这种情况出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,拒绝原假设的理由越充分。P值是H0能被拒绝的最小值。α是上限控制值二、双侧检验的p值若p值≥α/2,不拒绝H0若p值<α/2,拒绝H0...原创 2021-10-25 21:26:10 · 6347 阅读 · 0 评论 -
统计学学习日记:L9-假设检验
一、假设1.对总体参数得到数值所作的一种陈述 总体参数包括总体均值,比例,方差等 分析之前必须陈述2.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立3.有参数假设检验和非参数假设检验4.采用逻辑上的反证法,依据统计上的小概率原理(小概率事件在一次事件中是不可能发生的,一般认为小于等于0.05)二、原假设1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号=,≤或≥4.表示为H0...原创 2021-10-24 22:23:24 · 3073 阅读 · 0 评论 -
统计学学习日记:L8-参数估计
目录一、估计量与估计值二、评估统计量的标准三、点估计四、区间估计一、估计量与估计值1.估计量:用于估计总体参数的随机变量 如样本均值、样本比例、样本方差等 例如:样本均值就是总体均值μ的一个估计量2.参数用θ表示,估计量用表示3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值x拔=80,则80就是μ估计值二、评估统计量的标准1.无偏性:估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择...原创 2021-10-22 22:20:49 · 782 阅读 · 0 评论 -
统计学学习日记:L7-离散趋势分析之偏态和峰态
一、偏态(SK)1.数据偏斜程度的测度 偏态系数=0为对称分布 偏态系数>0为右偏分布偏态系数<0为左偏分布 偏态系数>1或<-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度越低2.偏态系数是已经去量纲后的参数(除以标准差)例:二、峰态 (K)1.数据分布偏平程度的测度 峰态系数=0扁平程度适...原创 2021-10-21 22:51:32 · 6279 阅读 · 0 评论 -
统计学学习日记:L6-离散趋势分析之总体方差和标准差
一、数据型数据:方差和标准差1.数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差),记为δ²(δ);根据样本数据计算的,称为样本方差(标准差),记为s²(s)1.1 总体方差与标准差1.1.1 方差的公式未分组数据组距分组数据1.1.2标准差的公式未分组数据组距分组数据1.2 样本方差与标准差1.2.1 方差的公式未分组数据组距分组数据1.2.2标准差的公式...原创 2021-10-21 22:01:18 · 2428 阅读 · 0 评论 -
统计学学习日记:L5-离散趋势分析之异众比率与四分位差
目录一、离中趋势二、分类数据:异众比率三、顺序数据:四分位差一、离中趋势1.数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值二、分类数据:异众比率1.对分类数据离散程度的测度2.非众数组的频数占总频数的比例3.计算公式为fi:总频数 fm:非众数组的频数4.用于衡量众数的代表性例:检验日化用品是否能代表一天的销售情况Vr=(5...原创 2021-10-20 22:18:36 · 3811 阅读 · 0 评论 -
统计学学习日记:L4-集中趋势分析之四分位数和各均值的比较
一、四分位数1.排序后处于25%和75%位置上的值2.不受极端值的影响3.计算公式:Q₁位置=¼n Q₃位置=¾n原创 2021-10-20 21:20:22 · 3861 阅读 · 1 评论 -
统计学学习日记:L3-集中趋势分析之平均数
一、平均数1.也称为均值2.集中趋势的最常用测度值3.一组数据的均衡点所在4.体现了数据的必然性特征5.易受极端值的影响6.有简单平均数和加权平均数之分7.根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为x拔二、算术平均数总体平均数是个定值,样本平均数会随抽样而改变。三、加权平均数例:(145*4+155*9+165*16……+235*5)/(4+9+16+……+5)=185四、几何平均数...原创 2021-10-19 22:36:02 · 1831 阅读 · 0 评论 -
统计学学习日记:L2-集中趋势分析之众数和中位数
一、众数1.一组数据中出现次数最多的变量值2.适用于数据量较多时使用3.不受极端值的影响4.一组数据中可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据或数值型数据在集中趋势分析中众数的三个表现形式例1:在这道题中,品类为分类变量,频数就是变量值,日化用品频数为150,占的比例最大,所以众数为日化用品这个品类,即M0=日化用品例2:在这道题中,数据为顺序数据,变量为回答类别,住户对超市表示满意的户数最多,为100,所以众数为“满意...原创 2021-10-19 17:21:45 · 2446 阅读 · 0 评论 -
统计学学习日记:L1-样本、总体和变量
一、统计数据类型1.1 按计量尺度划分1.1.1 分类数据能归于某一类别的非数字型数据,是对事物进行分类的结果,,数据表现为类别,是用文字来描述。如人口按照性别划分为男,女;企业按行业属性划分为医药企业、家电企业……1.1.2 顺序数据只能归于某一有序类别的非数字型数据,顺序数字虽然是有类别的,但是这些类别都是有序的。如产品分为一等品、二等品、三等品、次品;考试成绩分为满分、优秀、及格、不及格。1.1.3 数值型数据是按数字尺度测量的观测值,其结果表现为具体的数值,现实中原创 2021-10-18 22:05:43 · 1648 阅读 · 0 评论