什么是误差函数?
在正态分布的上下文中,erf
代表“误差函数”(Error Function),这是一个在概率论、统计学和偏微分方程中常见的数学函数。误差函数 erf(x)
是正态分布的一个重要组成部分,它被用来计算正态分布曲线下,从负无穷到 x
的积分值,即变量落在某个范围内的概率。
误差函数的定义为:
erf(x)=2π∫0xe−t2dt\text{erf}(x) = \frac{2}{\sqrt{\pi}} \int_{0}^{x} e^{-t^2} dterf(x)=π2∫0xe−t2dt
在统计学中,误差函数常用于计算变量在正态分布中的累积分布概率。对于具有零均值和单位方差的标准正态分布,累积分布函数可以用误差函数来表示:
Φ(x)=12[1+erf(x2)]\Phi(x) = \frac{1}{2} \left[1 + \text{erf}\left(\frac{x}{\sqrt{2}}\right)\right]Φ(x)=21[1+erf(2x)]
其中,Φ(x)
是标准正态累积分布函数,用于计算随机变量小于或等于 x
的概率。
在控制系统和机器学习等领域,误差函数有助于处理与正态分布相关的问题,如在计算机会约束(chance constraints)时评估在给定置信水平下的阈值,以确保约束满足特定的概率要求。
如何计算?
对于一个随机变量 XXX 和给定的 xxx,表达式 Pr(−x≤X≤x)\text{Pr}(-x \leq X \leq x)Pr(−x≤X≤x) 表示随机变量 XXX 的值落在 −x-x−x 和 xxx 之间的概率。这可以通过累积分布函数(CDF)来计算。
对于正态分布的随机变量,可以用以下步骤来计算这个概率:
-
标准化过程:
如果 XXX 是正态分布的,那么它可以用均值 μ\muμ 和标准差 σ\sigmaσ 来描述。为了计算概率,我们通常先将 XXX 转换为标准正态分布变量 ZZZ,其中 ZZZ 的均值为 0,标准差为 1。这是通过以下公式完成的:
Z=X−μσZ = \frac{X - \mu}{\sigma}Z=σX−μ -
使用标准正态累积分布函数:
一旦 XXX 被标准化为 ZZZ,就可以使用标准正态累积分布函数 Φ(z)\Phi(z)Φ(z)来计算 ZZZ 落在特定区间的概率。标准正态CDF可以用误差函数(erf)表示:
Φ(z)=12[1+erf(z2)]\Phi(z) = \frac{1}{2} \left[1 + \text{erf}\left(\frac{z}{\sqrt{2}}\right)\right]Φ(z)=21[1+erf(2z)] -
计算双边概率:
对于 Pr(−x≤X≤x)\text{Pr}(-x \leq X \leq x)Pr(−x≤X≤x),需要计算 XXX 落在 −x-x−x 和 xxx 之间的概率。这可以通过计算 ZZZ 落在 −x−μσ\frac{-x - \mu}{\sigma}σ−x−μ 和 x−μσ\frac{x - \mu}{\sigma}σx−μ 之间的概率来实现。因为标准正态分布是对称的,可以利用这一点来简化计算:
Pr(−x≤X≤x)=Φ(x−μσ)−Φ(−x−μσ)\text{Pr}(-x \leq X \leq x) = \Phi\left(\frac{x - \mu}{\sigma}\right) - \Phi\left(\frac{-x - \mu}{\sigma}\right)Pr(−x≤X≤x)=Φ(σx−μ)−Φ(σ−x−μ)
因为 Φ(−z)=1−Φ(z)\Phi(-z) = 1 - \Phi(z)Φ(−z)=1−Φ(z),所以:
Pr(−x≤X≤x)=Φ(x−μσ)−[1−Φ(x+μσ)]\text{Pr}(-x \leq X \leq x) = \Phi\left(\frac{x - \mu}{\sigma}\right) - \left[1 - \Phi\left(\frac{x + \mu}{\sigma}\right)\right]Pr(−x≤X≤x)=Φ(σx−μ)−[1−Φ(σx+μ)]
Pr(−x≤X≤x)=2Φ(x−μσ)−1=erf(x−μ2σ)\text{Pr}(-x \leq X \leq x) = 2\Phi\left(\frac{x - \mu}{\sigma}\right) - 1 = \text{erf}\left(\frac{x - \mu}{\sqrt{2}\sigma}\right)Pr(−x≤X≤x)=2Φ(σx−μ)−1=erf(2σx−μ) (当 μ=0\mu = 0μ=0时)
通过这种方式,我们可以用标准正态累积分布函数来表示原始非标准正态随机变量的概率。这种转换使得我们能够利用已知的标准正态分布性质来计算概率,从而简化了分析过程。