概率的基础是由三个基本串接起来的:概率,概率分布以及分布函数以及概率密度。
概率要讲清楚要说明几点:事件,样本空间,讲清楚事件要首先介绍一下随即事件,什么是随机事件,就是结果是短期看是不确定的,但是从长期看又是有一定统计性规律的,称之为随即现象。作为概率研究的大前提就是随机现象。
然后随机现象呢需要随机试验来进行体现,我们知道,随机现象是不可能穷尽的,随机试验本身是获取随机现象
全体(历史)子集的过程。这个全体子集就称之为“
样本空间”;样本空间每个元素就称之为
样本(点)。还没完,这个样本空间的子集(由部分样本点组成)称之为
“随机事件”。
如果你的试验结果是可以穷举的那么就是一个离散事件,如果不可穷举,而且具有
下面概率要做的事情就是根据这些个随机事件来推测出某个随机现象的规律。通过什么来推测?通过频率。频率是随机试验的结果,有一组数据组成,那么根据这一组数据获取了某个随机事件发生的频率。频率是事实计算出来;那么概率呢?就是
根据一组实验结果获取的频率来预估随机现象的统计性规律,这个统计性规律就是概率。
概率要做的事情就是要根据有限次数的试验结果来描摹随机现象的规律。
解释完毕了概率,下面是概率分布,这个概念其实是对于概率的一个充实,随机变量类型有两种,一种是离散随机变量;另外一种是连续性随机变量,前者是指随机变量取值是可以穷举的,比如麻将盘我随即取出一个,是什么,就是中发白,条饼万;还有一类是连续的,比如某个时刻的温度,这个样本取值是无法穷举的,这种叫做连续性随机变量。概率分布是针对离散型随机变量而言的一种数学表达,即某个取值的概率,记做P{X=x};最常见的概率分布式0-1分布,抛硬币就是0-1分布,我们知道其正面概率和背面概率都是50%;推广一下,如果样本值有N种,那么某个样本值取值的概率的分布就叫做二项式分布;任何一个取值分析的时候都是有两种情况,一种是取值为指定值,另外一种是取值为非指定值。对于二项式分布而言,有三个元素需要考虑,分别是:实验的次数,实验过程产生指定值的次数以及历史上频率。