多项分布

多项分布:从二项分布到多元概率世界
1、背景
多项式分布(Multinomial Distribution)是二项式分布的推广。
二项分布的典型例子是扔硬币,硬币正面朝上概率为p, 重复扔n次硬币,k次为正面的概率即为一个二项分布概率。(严格定义见 伯努利实验定义)。把 二项分布 公式推广至多种状态,就得到了多项分布。
2、多项分布
某随机实验如果有k个可能结局A1、A2、…、Ak,分别将他们的出现次数记为随机变量X1、X2、…、Xk,它们的 概率分布 分别是p1,p2,…,pk,那么在N次采样的总结果中,A1出现n1次、A2出现n2次、…、Ak出现nk次的这种事件的出现概率P有下面公式:
3、多项分布的性质

### 多项分布的求和及其计算方法 多项分布在统计学中是一种离散型的概率分布,它是二项分布的一种推广形式。当实验的结果有多个类别而非仅两个时(如掷骰子),可以使用多项分布描述这些类别的概率特性。 #### 1. 多项分布的基础定义 假设一次试验可能产生的结果属于 \(k\) 类别之一,每种结果发生的概率分别为 \(\{p_1, p_2, ..., p_k\}\),其中满足条件: \[ \sum_{i=1}^{k} p_i = 1 \] 对于独立重复 \(n\) 次这样的试验,设随机变量 \(X_i\) 表示第 \(i\) 种结果出现的次数,则向量 \((X_1, X_2, ..., X_k)\) 遵循参数为 \(n\) 和 \(\{p_1, p_2, ..., p_k\}\) 的多项分布[^1]。 #### 2. 多项分布的概率质量函数 (PMF) 多项分布的概率质量函数可写为: \[ P(X_1=x_1, X_2=x_2,...,X_k=x_k | n, p_1,p_2,...,p_k)=\frac{n!}{x_1!x_2!...x_k!}p_1^{x_1}p_2^{x_2}...p_k^{x_k}, \] 其中约束条件为: \[ x_1+x_2+...+x_k=n,\quad x_i\geq0.\] 此公式用于计算特定组合下各分类频数的具体概率值。 #### 3. 总体求和的意义 在某些场景下,研究者关心的是某一组分类合计的发生频率或者期望值。例如,在市场调研数据中分析不同年龄段人群的选择偏好时,可能会希望知道某几个年龄层的人群总数占总体的比例。此时就需要对部分或全部分类进行汇总处理。 #### 4. 数学表达式的转换 如果要求数个指定分类 (\(C=\{c_j| j \in J\subset K\}\)) 发生总次数\(S_C\) 的分布情况,则可通过如下方式构建新的简化模型: 令新随机变量 \(Y=S_C=\sum_{j\in C}X_j\), 那么根据线性性质可知其均值与方差分别为: \[ E[Y]=E[\sum_{j\in C}X_j ]=\sum_{j\in C}np_j ,\] \[ Var(Y)=Var(\sum_{j\in C}X_j )=\sum_{j\in C} np_j(1-p_j). \] 注意这里忽略了交叉项因为各个维度间相互独立[^2]。 #### 5. 实际应用中的数值积分技术 尽管上述推导提供了理论上精确解答路径,但在高维空间或多状态情形下直接解析求解变得极其困难甚至不可能完成。这时便引入诸如蒙特卡洛模拟法或是利用复化辛普森法则等数值逼近手段辅助解决此类难题[^4]。 下面展示一段基于Python实现简单版本的复化辛普森公式的代码片段作为示范用途: ```python def simpson(f,a,b,n): h=(b-a)/n s=f(a)+f(b) for i in range(1,int(n/2)): xi=a+(2*i)*h s+=4*f(xi) for i in range(1,int(n/2)-1): xi=a+(2*i+1)*h s+=2*f(xi) return s*h/3. ``` 通过调整输入参数`a`, `b`, 及分割数目`n`即可灵活适应不同的具体应用场景需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值