统计学基础与应用
1. 引言
在当今数据驱动的时代,无论是科学家、工程师、经济学家、社会学家,还是普通大众,都需要具备一定的统计学知识。因为我们在职业或个人生活中,常常需要解读各种数据。尽管我们不一定完全认同“世界上有三种谎言:谎言、该死的谎言和统计数据”这一观点,但我们至少应该能够批判性地评估那些利用(甚至滥用)统计数据来影响我们的言论。
统计学是一个庞大的学科,在传统的数值方法课程中往往难以全面涵盖,因此这里只是对其进行简单的介绍,并且省略了很多数学细节。
2. 统计术语
2.1 随机变量
随机变量是指在一个过程的每次重复中取值都会变化的量,也称为随机或随机变量。例如,彩票抽奖中第一个被抽出的数字,或者伦敦市中心的中午温度,都是随机变量的例子。
2.2 频率分布
- 直方图 :像展示学生计算机成绩在给定范围内的数量的图表,就是直方图。它由一系列矩形组成,每个矩形的宽度与数值范围成正比,高度与该范围内事件发生的频率成正比。例如,一个展示学生考试成绩分布的直方图,不同成绩区间用矩形表示,矩形高度代表该区间内学生的数量。
- 频率分布 :我们也可以用图形记录一系列点来展示特定事件的频率,连接这些点形成的曲线就是频率分布。其中,具有熟悉的钟形形状的频率分布被称为正态分布。正态分布是许多动物和人类特征、心理测量、物理现象以及经济和社会活动结果的频率的良好模型,在统计学中具有重要地位。
2.3 期望值、平均值和均值
随机变量的期望值被定
超级会员免费看
订阅专栏 解锁全文
1055

被折叠的 条评论
为什么被折叠?



