概率和概率分布是推断统计的基础,学好这一章对后面学习推断统计(参数估计、假设检验、方差分析等)至关重要。
1 基本概念
试验:对事物或现象的观察或实验称为试验
样本点:试验的结果称为样本点
基本空间(样本空间):一个试验中所有的可能结果(样本点)称为样本空间或基本空间,用S表示
基本事件(简单事件):一个事件,如果不能拆解为2个或更多个样本点
如投掷硬币的试验,S={正面,反面};检测零件的试验,样本空间为S={合格,不合格}
2 概率
事件:是样本点的集合,事件的概率等于该事件包括的样本点的概率之和
事件在试验中出现的可能性大小称为事件的概率,对概率的研究最早起源于17世纪50年代。概率取值为[0,1]之间,若概率为0,表明事件几乎不可能发生,称为不可能事件;若概率为1,表明事件几乎一定会发生,称为必然事件;若概率介于0和1之间,代表事件发生可能性的程度,称为随机事件
随机事件:每次试验,可能出现也可能不出现的事件,通常用大写英文字母表示,如A,B等
必然事件:每次试验,必定会出现的事件,用表示
不可能事件:每次试验,一定不会出现的事件,用表示
⚠️概率论研究的是随机事件,并且把必然事件与不可能事件包括在随机事件内作为两个极端来看待
2.1 试验结果确认和计数
对试验结果(样本点)进行确认和计数是计算概率的基础,因此,将介绍三种实用的计数法则:
2.1.1 多步骤试验的计数法则
如果一个试验可以分为有序的k个步骤,在第1步中有种试验结果,在第2步中有
种试验结果...以此类推,那么所有可能的试验结果的总数为
;而树形图是一种帮助分析多步骤试验的图形,树形图右侧的每一个节点对应着试验的一种结果(从树型图左侧节点通往右侧的每一条路径对应着试验的一种结果)
案例一:投掷2枚硬币,可能的结果总共有2*2=4种
案例二:某工程分为两个步骤:步骤1(设计阶段)和步骤2(建设阶段),设计阶段完工可能需要2、3或4个月,而建设阶段完工可能需要6、7或8个月。基于多步骤试验的计数法则,可知该工程的总完工时间总共有3*3=9种可能
2.1.2 组合的计数法则
2.1.3 排列的计数法则
2.2 试验结果概率分配
基于对概率的不同解释,概率的定义有所不同,主要有古典定义、统计定义和主观定义。
2.2.1 古典定义法
古典定义起源于赌博,如掷硬币、掷骰子等,这些活动都比较简单,有两个重要的共同点:
(1)试验结果有限:即样本空间中只包含有限个样本点,如掷硬币试验,只出现“正面”、“反面”两种结果
(2)各个结果出现的可能性被认为是相同的,如掷硬币试验,出现正面或反面的可能性被认为是相同的
具有上述两个特点的随机试验所研究的问题称为“古典概型”
如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为:
2.2.2 统计定义法
由于古典概率要求随机试验结果有限个且每个结果可能性相同,使得应用受到很大限制,因此人们又提出根据事件在多次重复试验中发生的频率确定其概率的方法,即概率的统计定义:在相同条件下重复随机试验n次,某事件A出现m次,则m/n为事件发生的频率,随着试验次数n增大,该频率值会在某个值上下波动,且波动幅度越来越小,这个频率的稳定值即为该事件的概率。
2.2.3 主观定义法
概率的统计定义也有局限性,有些时候,难以保证每次试验条件都相同,或者有些没法重复做多次试验,这种情况下,往往只能利用一切可以掌握的信息,例如历史经验和直觉等,当考虑所有掌握的信息后,主观为试验结果分配一个介于0和1之间的概率值,不同的人会对同一试验结果给出不同的概率值。
⚠️无论是采用古典定义、统计定义还是主观定义,都必须满足以下条件(假设表示第i种试验结果,
表示这种结果发生的概率):
(1)
(2)
2.3 概率的基本性质
⚠️只要能确认一个试验的所有可能结果(样本点)并且为其分配概率,就能够根据定义来计算某一事件的概率;但是若试验中存在大量样本点,会使得确认样本点和分配概率变得相当繁重,因此将学习概率的一些基本性质,根据这些性质可以在不知道每个样本点概率的情况下计算事件的概率。
2.3.1 事件的补集、并集、交集
给定一个事件A,事件A的补为“所有不包含在事件A中的样本点“,计为,下图为“文氏图”
在任何概率应用中,事件A和它的补必有一个发生,因此,有
两个事件的并:事件A和事件B的并是所有属于A或B或同时属于二者的样本点构成的事件,记作,用文氏图表示如图4-5所示
两个事件的交:同时属于A和B的样本点构成的事件,记作,用文氏图表示如图4-6所示
2.3.2 加法公式
加法公式:
⚠️从直观上看,加法公式右边的前两项已经包含了所有
的样本点,但是由于
内的样本点既属于A又属于B,在计算
时
内的样本点被计算了两次,因此需从中减去
,对重复计算进行修正。
2.3.3 互斥事件
互斥事件:如果两个事件没有公共的样本点,则称这两个事件互斥(即事件A和事件B中一个发生而另一个一定不会发生时,则称A和B是互斥的)
⚠️互斥事件的加法公式:
2.3.4 条件概率
条件概率:某个事件发生的可能性经常会受到另一个相关事件发生与否的影响,假设事件A发生的概率为P(A),如果获得了新的信息--确知另一个相关事件B已经发生了,我们希望利用这一新的信息来重新计算事件A发生的可能性,此时事件A发生的可能性为条件概率,记作P(A|B),读作“事件B发生的条件下事件A发生的概率“。
或