最近在调研域自适应学习的时候,接触到了分布假设,即源域与目标域的边缘分布和条件分布均不同。条件分布由于用得比较多,大家应该比较熟知;而边缘分布用的比较少,在这里记录下边缘分布的定义,备忘。
##边缘分布的定义
1、定义 1
设F(x,y)F(x,y)F(x,y)为二维随机变量 (X,Y)(X,Y)(X,Y) 的联合分布函数,F(x,y)=P{X≤x,Y≤y}F(x,y)=P\{X\leq x, Y\leq y\}F(x,y)=P{X≤x,Y≤y},分别称
P{X≤x}=P{X≤x,Y<∞}=F(x,∞)≜FX(x)P\{X\leq x\} = P\{X\leq x, Y <\infty \} = F(x,\infty)\triangleq F_X(x)P{X≤x}=P{X≤x,Y<∞}=F(x,∞)≜FX(x)
P{Y≤y}=P{X<∞,Y≤y}=F(∞,y)≜FY(y)P\{Y\leq y\} = P\{X< \infty, Y \leq y\} = F(\infty,y)\triangleq F_Y(y)P{Y≤y}=P{X<∞,Y≤y}=F(∞,y)≜FY(y)
为二维随机变量(X,Y)(X,Y)(X,Y)关于XXX和关于YYY的边缘分布函数。
2、定义 2
设二维离散型随机变量 (X,Y)(X,Y)(X,Y)的联合分布律为
P{X=xi,Y=yj}=pij,i,j=1,2,⋯P\{X=x_i,Y=y_j\}=p_{ij}, i,j=1,2,\cdotsP{X=xi,Y=yj}=pij,i,j=1,2,⋯
记
pi⋅=∑j=1∞pij=P{X=xi},i=1,2,⋯p_{i\cdot}=\sum_{j=1}^\infty p_{ij}=P\{X=x_i\}, i=1,2,\cdotspi⋅=∑j=1∞pij=P{X=xi},i=1,2,⋯
p⋅j=∑i=1∞pij=P{Y=yj},j=1,2,⋯p_{\cdot j}=\sum_{i=1}^\infty p_{ij}=P\{Y=y_j\}, j=1,2,\cdotsp⋅j=∑i=1∞pij=P{Y=yj},j=1,2,⋯
分别称pi⋅(i=1,2,⋯ )p_{i\cdot}(i=1,2,\cdots)pi⋅(i=1,2,⋯) 和 p⋅j(j=1,2,⋯ )p_{\cdot j}(j=1,2,\cdots)p⋅j(j=1,2,⋯)为二维离散型随机变量(X,Y)(X,Y)(X,Y)关于X和关于Y的边缘分布律。
3、几何意义
这里选择定义1进行解释:由定义1,二维随机变量(X,Y)(X,Y)(X,Y)可视为平面上的随机点(为方便,随机点与随机变量可视为等同),二维随机变量(X,Y)(X,Y)(X,Y)的(联合)分布函数F(X,Y)=P{X≤x,Y≤y}F(X,Y)=P\{X\leq x, Y\leq y\}F(X,Y)=P{X≤x,Y≤y}的几何意义显然是随机点(X,Y)(X,Y)(X,Y)落在平面区域{(x,y)∣X≤x,Y≤y}\{(x,y)|X\leq x, Y\leq y\}{(x,y)∣X≤x,Y≤y}内发生的概率,见图1。
二维随机变量(X,Y)(X,Y)(X,Y)关于XXX的边缘分布函数FX(x)F_X(x)FX(x)表示平面上的随机点(X,Y)(X,Y)(X,Y)落在平面直线X=xX=xX=x 左边平面区域内(含直线){(x,y)∣X≤x,Y<∞}\{(x,y)|X\leq x, Y<\infty\}{(x,y)∣X≤x,Y<∞}发生的概率,见图2。
(X,Y)(X,Y)(X,Y)关于YYY的边缘分布函数FY(y)F_Y(y)FY(y)表示平面上的随机(X,Y)(X,Y)(X,Y)落在直线Y=yY=yY=y下边平面区域内(含直线){(x,y)∣X<∞,Y≤y}\{(x,y)| X<\infty,Y\leq y\}{(x,y)∣X<∞,Y≤y}发生的的概率,见图3。