
统计学基础
统计学
大虎牙
一物不知 深以为耻 便求知若渴
展开
-
学习笔记 | 分析连续数据的数学
01 对于无限的理解02 极限“若x无限放大,则函数f(x)无限接近于定数p”可以表示为:在这种情况下,p被称作f(x)的极限值。03 欧拉常数e用以下极限来定义的定数e被称作欧拉常数或自然对数的底。04 积分:求解面积积分与面积y=f(x)与x=a、x=b(a<b)以及x轴围成的图形面积S,使用∫与dx表示如下:05 连续型随机变量与概率密度函数取连续型数据的随机变量X被称为连续型随机变数。概率密度函数连续型随机变数X取值范围为a≤X≤b时,其概率P(a≤.原创 2020-06-23 10:23:23 · 1146 阅读 · 0 评论 -
学习笔记 | 分析离散数据的数学
统计学就是从世间许许多多的偶然中提炼出规律,并且利用这些规律推测出总体情况的一门学问。 01 n!(n的阶乘)的定义n! = n×(n-1)×(n-2)× ... ×3×2×102 排列考虑到顺序的时候,被称为排列。排列(从不同的n个单位中选出r个的排列)的一般式03 组合不考虑顺序时被称为组合。组合(从n个单位中选出r个的组合)的一般式04 二项系数(a+b)n的展开式中,an-kbk的系数为CnkC^k_ {n}Cnk。二项定理05 概率试验:一.原创 2020-06-11 17:57:50 · 2859 阅读 · 0 评论 -
学习笔记 | 研究关联性、相关系数
01 二次函数、二次方程式、二次不等式二次函数二次方程式ax2+bx+c=0 这是二次方程式的一般式。“y=0”在坐标图上则代表x轴本身。即将y=0代入二次方程式所得到的两个解,就是二次函数的图像与x轴的交点(x坐标)。二项不等式02 点位图要抓住两个变量之间的倾向特征,就必须要用到别的图表,这就是点位图(又称散布图)。将双变量数据加以整理并做成点位图后,可以得出两个变量(大致的)相关关系的有无与强弱。关于相关关系的注意点(1)得到的倾向特征,并非是其一般特征。(2原创 2020-06-08 18:18:32 · 2963 阅读 · 0 评论 -
学习笔记 | 累积分布函数
分布数据的分布,它描述了各个值出现的频繁程度;表示分布最常用的方法是直方图;频数指的是数据集中一个值出现的次数;概率质量函数PMF这个函数是值到其概率的映射;概率是频数除以样本数量;借助PMF,可以更清晰地看出分布的差异;归一化:将频数除以样本数量得到概率的过程;异常值:远离众数的值叫做异常值;相对风险:两个概率的比值,通常用于衡量两个分布的差异;条件概率:依赖于某一个条件的概率 01 累积分布函数CDF01 百分位数举例:标准化考试的成绩一般会以两种形式呈现:原始分数原创 2020-06-07 18:47:41 · 6060 阅读 · 0 评论 -
学习笔记 | 描述分散趋势
01 描述性统计量 | 描述分散趋势标准差标准差是离均差(x-u)平方和平均后的方根,用σ表示。方差是标准差的平方; 标准差是方差的算术平方根。原创 2020-06-07 18:46:14 · 776 阅读 · 0 评论 -
学习笔记 | 描述集中趋势
一.描述性统计量均值(描述集中趋势),中位数,众数标准差,方差(描述分散趋势)标准差是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。方差是标准差的平方;分布数据的分布,它描述了各个值出现的频繁程度;表示分布最常用的方法是直方图;频数指的是数据集中一个值出现的次数;概率质量函数PMF这个函数是值到其概率的映射;概率是频数除以样本数...原创 2019-10-13 13:23:45 · 2038 阅读 · 0 评论 -
学习笔记 | 条件概率、联合概率、全概率公式、贝叶斯公式
定义边缘概率(又称先验概率):某个事件发生的概率。边缘概率是这样得到的:在联合概率中,把最终结果中那些不需要的事件通过合并成它们的全概率,而消去它们(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率),这称为边缘化(marginalization)。比如A的边缘概率表示为P(A),B的边缘概率表示为P(B)。联合概率表示两个事件共同发生的概率。A与B的联合概率表示为P(A∩B...原创 2020-05-08 10:35:34 · 3633 阅读 · 0 评论 -
学习笔记 | 统计与分布 | 常用指标和术语
数据分析 | 常用指标和术语平均数它的特点是将总体内各单位的数量差异抽象化、代表总体的一般水平,掩盖了总体内各单位的差异。绝对数与相对数绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。相对数是指两个有联系的指标对比计算而得到的数值,用以反应客观现象之间数量联系程度的综合指标。相对数一般以倍数、成数、百分数等表示。百分比与百分点百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。频数与频率频数是指一组数据中个别数据重复出现原创 2020-05-14 00:25:34 · 1167 阅读 · 0 评论 -
学习笔记 | 假设检验概念、小概率事件、P-Value与显著性水平、假设检验步骤
01 假设检验概念02 小概率事件03 P-Value与显著性水平04 假设检验步骤原创 2020-06-04 18:08:27 · 7522 阅读 · 1 评论