概率论知识回顾(十六)
重点:数学期望、中位数的一般化定义
知识回顾用于巩固知识和查漏补缺。知识回顾步骤:
- 查看知识回顾中的问题,尝试自己解答
- 自己解答不出来的可以查看下面的知识解答巩固知识。
- 对知识解答有疑问的,说明有关这一点的知识或者公式没有理解透彻或者没有记住,要重新翻看书籍。
知识回顾
- 简单概述 R−SR-SR−S 积分。
- 简单概述数学期望的一般化定义。
- 简述中位数定义及其优缺点。
知识解答
- 简单概述 R−SR-SR−S 积分。
- 定义:设 g(x)g(x)g(x) 是定义在 (a,b](a, b](a,b] 上的实函数,而 F∗(x)F^*(x)F∗(x) 是定义在实数轴上的单调不减,右连续的实函数。(这个符合分布函数的一些定义)。取分点 a=x0<x1<⋯<xn=ba = x_0 < x_1 < \cdots < x_n = ba=x0<x1<⋯<xn=b, 从 (xi−1,xi)(x_{i-1}, x_i)(xi−1,xi) 中取一点 xi−1<x~i<xix_{i-1}<\tilde{x}_i < x_ixi−1<x~i<xi , 记 σ=∑i=1ng(x~i)[F∗(xi)−F∗(xi−1)]\sigma = \sum_{i=1}^{n}g(\tilde{x}_i)[F^*(x_i) - F^*(x_{i-1})]σ=∑i=1ng(x~i)[F∗(xi)−F∗(xi−1)] 。如果有 λ=max1≤i≤n(xi−xi−1)→0\lambda = \max_{1\le i\le n}(x_i - x_{i-1}) \rightarrow 0λ=max1≤i≤n(xi−xi−1)→0 以及 σ\sigmaσ 的极限存在,则称此极限为 g(x)g(x)g(x) 在 (a,b](a, b](a,b] 上关于函数 F∗(x)F^*(x)F∗(x) 的 R−SR-SR−S 积分。记为 ∫abg(x)dF∗(x)\int_{a}^{b}g(x)dF^*(x)∫abg(x)dF∗(x)
- 当然,当 a→−∞,b→+∞a \rightarrow -\infty, b \rightarrow+\inftya→−∞,b→+∞ 的时候呢,σ\sigmaσ 的极限存在,就记为 g(x)g(x)g(x) 在 (−∞,+∞)(-\infty, +\infty)(−∞,+∞) 上关于函数 F∗(x)F^*(x)F∗(x) 的 R−SR-SR−S 积分,记作 ∫−∞+∞g(x)dF∗(x)\int_{-\infty}^{+\infty}g(x)dF^*(x)∫−∞+∞g(x)dF∗(x)
- 另一方面,取 F∗(x)为F(x)F^*(x) 为 F(x)F∗(x)为F(x), 假设 F(x)F(x)F(x) 为分布函数,f(x)f(x)f(x) 为密度函数,则有 ∫abg(x)dF(x)=∫abg(x)f(x)dx\int_{a}^{b}g(x)dF(x) = \int_{a}^{b}g(x)f(x)dx∫abg(x)dF(x)=∫abg(x)f(x)dx。推广到 −∞,+∞-\infty, +\infty−∞,+∞ 上和第二点类似。
- 另外定义在 (a,b](a, b](a,b] 上的 R−SR-SR−S 积分是不包含 aaa 点的 ,这个是需要严格区分的,因为就期望计算来说,由于就离散随机变量来说,在某点的概率不一定为零。
- 性质
- $\int_{a}^{b}[\alpha g_1(x) + \beta g_2(x)]dF^(x) = \alpha\int_{a}^{b}g_1(x) dF^(x) + \beta\int_{a}^{b} g_2(x)dF^*(x) $
- ∫abg(x)d[αF1∗(x)+βF2∗(x)]=α∫abg(x)dF1∗(x)+β∫abg(x)dF2∗(x)\int_a^b g(x)d[\alpha F_1^*(x) + \beta F_2^*(x)] = \alpha\int_a^bg(x)dF_1^*(x) + \beta \int_a^bg(x)dF_2^*(x)∫abg(x)d[αF1∗(x)+βF2∗(x)]=α∫abg(x)dF1∗(x)+β∫abg(x)dF2∗(x)
- 当 g(x)=1g(x) = 1g(x)=1 时,R−SR-SR−S 积分为 ∫abdF(x)=P{a<x≤b}\int_a^bdF(x) = P\{a < x \le b\}∫abdF(x)=P{a<x≤b}
- 由这一个特性,我们就知道 P{X∈D}=∫DdF(x)P\{X \in D\} = \int_DdF(x)P{X∈D}=∫DdF(x)
- P{(X,Y)∈D}=∬DdF(x,y)P\{(X, Y) \in D\} = \iint_DdF(x, y)P{(X,Y)∈D}=∬DdF(x,y)
- 简单概述数学期望的一般化定义。
- 首先我们来看看数学期望的定义 ∑ipixi\sum_ip_ix_i∑ipixi,由于概率密度并不一定是都存在,而无论是离散随机变量函数连续随机变量 pi=F(xi)−F(xi−0)p_i = F(x_i) - F(x_i - 0)pi=F(xi)−F(xi−0)
- 我们来看看 R−SR-SR−S 积分的形式:σ=∑i=1ng(x~i)[F∗(xi)−F∗(xi−1)]\sigma = \sum_{i=1}^{n}g(\tilde{x}_i)[F^*(x_i) - F^*(x_{i-1})]σ=∑i=1ng(x~i)[F∗(xi)−F∗(xi−1)], 当 λ=max1≤i≤n(xi−xi−1)→0\lambda = \max_{1\le i\le n}(x_i - x_{i-1}) \rightarrow 0λ=max1≤i≤n(xi−xi−1)→0 的时候,F∗(xi)−F∗(xi−1)=piF^*(x_i) - F^*(x_{i-1}) = p_iF∗(xi)−F∗(xi−1)=pi, 而当这里的 g(x~i)=xig(\tilde{x}_i) = x_ig(x~i)=xi 的时候。就是我们数学期望的公式。
- 因此我们有: 假设随机变量 XXX 的分布函数为 F(x)F(x)F(x) 如果有 ∫−∞+∞∣x∣dF(x)<+∞\int_{-\infty}^{+\infty}|x|dF(x) < +\infty∫−∞+∞∣x∣dF(x)<+∞ 那么就定义 E(X)=∫−∞+∞xdF(x)E(X) = \int_{-\infty}^{+\infty}xdF(x)E(X)=∫−∞+∞xdF(x)
- 对于随机变量的函数的数学期望,就有 E(Y)=Eg(x)=∫−∞+∞ydFY(y)=∫−∞+∞g(x)dF(x)E(Y) = Eg(x) = \int_{-\infty}^{+\infty}ydF_Y(y) = \int_{-\infty}^{+\infty} g(x)dF(x)E(Y)=Eg(x)=∫−∞+∞ydFY(y)=∫−∞+∞g(x)dF(x)
- 同理,对于n维随机变量,则有:如果 ∫−∞+∞⋯∫−∞+∞∣g(x1,x2,⋯ ,xn)∣dF(x1,x2,⋯ ,xn)<+∞\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}|g(x_1, x_2, \cdots, x_n)|dF(x_1, x_2, \cdots, x_n) < + \infty∫−∞+∞⋯∫−∞+∞∣g(x1,x2,⋯,xn)∣dF(x1,x2,⋯,xn)<+∞, 则 Eg(x1,⋯ ,xn)=∫−∞+∞⋯∫−∞+∞g(x1,x2,⋯ ,xn)dF(x1,x2,⋯ ,xn)Eg(x_1, \cdots, x_n) = \int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}g(x_1, x_2, \cdots, x_n)dF(x_1, x_2, \cdots, x_n)Eg(x1,⋯,xn)=∫−∞+∞⋯∫−∞+∞g(x1,x2,⋯,xn)dF(x1,x2,⋯,xn)
- 简述中位数定义及其优缺点。
- 对于中位数 xxx 来说,有 P{X≤x}≥12,P{X≤x}≥12P\{X \le x\} \ge \frac 1 2, P\{X \le x\} \ge \frac 1 2P{X≤x}≥21,P{X≤x}≥21
- 优点:不受数据中某些特别大或者特别小的值得影响,具有一些代表性
- 缺点:
- 没有数学期望那样的可计算性的性质,不利于在数学上的处理。只能单独表示某些属性。
- 中位数可以不唯一,同时也可能是一个无意义的值。