二元随机变量

本文深入探讨了二元随机变量的概念,包括二元离散型和连续型随机变量的定义,详细讲解了联合概率分布律、边际分布律、条件分布律,以及相应的分布函数和密度函数,为理解多维随机变量提供了坚实的理论基础。

转载:https://blog.youkuaiyun.com/flying_all/article/details/68950590

本章记录
 1二元随机变量的定义
 2二元离散型随机变量的定义、联合概率分布律、边际分布律、条件分布律
 3二元离散型随机变量联合概率分布律函数、边际分布函数、条件分布函数
 4二元连续型随机变量的定义、联合概率密度函数、边际密度函数、条件密度函数
二元随机变量
 举例:研究入学儿童的发育情况。从一个样本(儿童)的身高、体重,两个维度研究。这用面向对象的编程角度理解类似于一个实体,有两个属性。
 再个栗子:研究炮弹着点位置。每个样本(位置)由横坐标、纵坐标确定。
 这两个例子中每个样本的两个维度不是固定不变的,而是随机变化的。入学儿童的年龄在样本空间中就几乎不变(在我们国家入学年龄7岁),入学年龄就不是随机变量。
 定义:设E是一个随机试验,样本空间S={e},设X=X{e},Y=Y(e)是定义在S上的随机变量,由它们构成的向量(X,Y)称为二元随机变量,也称二维随机变量。

二元离散型随机变量
 定义:若二元随机变量(X,Y)全部可能取到不同的值是有限对,或者可列无数对,则称(X,Y)是二元离散型随机变量。
 
二元离散型随机变量的概率分布律
 定义:若(X,Y)所有可能取值为(xi,yj)(xi,yj)
 举例
 

二元离散型随机变量的边际分布律
 定义:离散型随机变量(X,Y)的边际分布律为P(X=xi)=j=1p(xi,yj)P(X=xi)=∑j=1∞p(xi,yj)
 

二元离散型随机变量的条件分布律
 定义:(X,Y)是二元离散型随机变量,对于固定的yjyj
 这里写图片描述

二元随机变量的边际分布函数
 定义:二元随机变量(X,Y)关于X的边际分布函数记为FX(x)FX(x)

二元随机变量的条件分布函数
 定义:如果P(Y=y)>0P(Y=y)>0

二元连续型随机变量
 定义:对于二元随机变量(X,Y)的分布函数F(x,y),如果存在非负函数f(x,y),使得对于任意x,y 有F(x,y)=xyf(u,v)dudvF(x,y)=∫−∞x∫−∞yf(u,v)dudv等于以D为底,曲面f(x,y)为顶面的柱体体积。
 4 在f(x,y)的连续点(x,y),有F(x,y)的二阶导=f(x,y)
 二元连续型随机变量的概率密度函数与分布函数之间就是积分与求导的关系了。

二元连续型随机变量边际概率密度函数
 定义:对于连续型随机变量(X,Y),概率密度函数为f(x,y),X,Y的边际概率密度函数为:
 fX(x)=+f(x,y)dyfX(x)=∫−∞+∞f(x,y)dy
 同理,若对于固定的X=x,且fX(x

### 二元随机变量概率分布及其在知识图谱中的应用 #### 联合概率密度分布 对于两个离散型或连续型的随机变量 \(X\) 和 \(Y\), 它们的联合概率密度函数表示这两个变量共同取特定值的可能性大小。如果考虑一个简单的例子,\(P(X=x, Y=y)\) 表示事件 \((X=x)\) 同时发生且事件 \((Y=y)\) 发生的概率。 在知识图谱 (KG) 中,实体间的关系可以通过构建多维空间内的节点连接来表达。例如,在医疗领域中,患者症状(如发烧、咳嗽)和可能患有的疾病之间存在着复杂的相互作用模式。这些模式可以用联合概率建模,即计算不同组合的症状与疾病的共现频率[^3]。 ```python import numpy as np from scipy.stats import multivariate_normal # 创建二维正态分布样本数据集 mean = [0, 0] covariance_matrix = [[1, .8], [.8, 1]] data_samples = multivariate_normal(mean=mean, cov=covariance_matrix).rvs(100) def plot_joint_distribution(data): """绘制给定数据的联合概率密度""" x, y = data.T plt.scatter(x, y, alpha=.5) plt.title('Joint Probability Density Distribution') plt.xlabel('Variable X') plt.ylabel('Variable Y') plt.show() plot_joint_distribution(data_samples) ``` #### 条件概率密度分布 条件概率是指在一个已知条件下另一个事件发生的可能性。对于二元随机变量而言,则是说当我们知道其中一个变量的具体数值之后,另外一个变量所服从的概率分布情况如何变化。形式上记作 \(P(Y|X)=\frac{P(X,Y)}{P(X)}\) ,这里假设分母不为零。 在 KG 上下文中,这可以帮助我们更好地理解因果关系链路。比如,如果我们已经观察到某个病人表现出某种特殊类型的头痛 (\(X=\text{"偏头痛"}\)) , 那么我们可以进一步推断他患有其他潜在健康问题 (\(Y=\text{"高血压"},\text{"颈椎病"}...\)) 的几率是多少。这种基于已有证据进行推理的能力正是现代智能诊断系统的核心功能之一。 #### 边缘概率密度分布 边缘概率指的是忽略掉某些因素的影响后剩余部分单独存在的机会有多大;换句话说就是只关心单个随机变量而不涉及任何其它相关联的对象。数学定义如下:\[ P(X)=∑_yP(X,y)=∫_{-\infty}^{+\infty}{f_X}(x)f_Y(y)d_y \] 当涉及到复杂网络结构时,了解各个孤立组件的行为特性同样重要。以社交平台为例,即使不知道用户之间的互动细节,也可以研究个体用户的活跃度趋势或者兴趣偏好等属性。因此,通过分析各独立节点上的统计规律有助于揭示隐藏在网络背后的宏观现象[^2].
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值