数理统计一(概率论)

一,课题导入:
这里写图片描述
这里写图片描述

二,统计学与概率论的关系
概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质; 而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、 估计等,都是统计推断的特殊形式,强调对于数据生成过程的研究。 统计学冲锋在应用第一线,概率论提供武器

三,统计学与机器学习的关系
1、统计学习近似等于机器学习。因 为机器学习中的大多数方法来自统计学比如: 聚类、贝叶斯等等,统计学的发展促进机器学习的繁荣昌盛;当然机器学习还有 很多其他的方法,如神经网络(更小范围)、SVM。
2、区别在于:统计学习者重点关注的是统计模型的发展与优化,偏数学,而机 器学习者更关注的是能够解决问题,偏实践,因此机器学习研究者会重点研究学 习算法在计算机上执行的效率与准确性的提升。

四,统计学的分类
1、统计可以分为:描述统计学与推断统计学
2、描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度。例 如:统计学生考试各个分段的人数分布等
3、推断统计学:根据样本数据推断总体数据特征。例如:产品质量检查

五,均值与中位数与众数的概念及计算
(1)均值:算术平均值,描述平均水平
u=1NNi=1Xi=1N(X1+X2+...+XN)u=1N∑i=1NXi=1N(X1+X2+...+XN)
(2)中位数:将数字排成有序,正中间的数描述中等水平
(3)众数:数据中出现最多的数

六,均值与中位数与众数区别

均值 中位数 众数
易受极端值影响 不受极端值影响 不受极端值影响
具有唯一性 具有唯一性 具有不唯一性
是一个通过计算得到的, 不是数据中的原始数据 是一个不完全“虚拟”的数 是一组数据中的原数据
数据分布对称或接近对称时使用 数据分布偏移程度较大时应用 数据分布偏移程度较大且有明显峰值时应用

七,均值与中位数与众数关系图
这里写图片描述

八,极差、方差与标准差的概念及计算
1. 极差
(1)作用:极差值大的表示数据分散,可以用来描述离散程度
(2)计算方式:最大值-最小值
(3)举例1: A={1,2,5,8,9} B={3,4,5,6,7}
A极差值:9-1=8 B极差值:7-3=4
【缺陷】若A——1 2 5 8 9 C——1 4 5 6 9 与上例题极差值相 同所以区别不了离散程度。
2. 方差
(1)公式: σ2=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值