每周学点数学 3:概率论基础2

1.独立性与相关性

在这里插入图片描述

独立性与相关性是在数据分析中非常重要的两个概念,它们之间存在一定的联系,但也有明显的区别。
独立性(Independence):独立性是指两个或多个变量之间不存在线性关系,它们之间的变化互不依赖。换言之,一个变量的变化不会引起另一个变量的变化。
相关性(Correlation):相关性是指两个变量之间存在线性关系,即它们的变化呈现出某种程度上的正相关或负相关。相关性可以用相关系数(如皮尔逊相关系数1、斯皮尔曼等级相关系数2等)来表示,它的值在-1到1之间,其中0表示完全不相关,1表示完全正相关,-1表示完全负相关。

异同点:
相同点:

  1. 独立性和相关性都是描述两个变量之间关系的概念。
  2. 独立性和相关性都可以帮助我们理解变量之间的关系,从而为后续的数据分析和模型构建提供依据。
    不同点:
  3. 独立性和相关性的定义不同:独立性强调两个变量之间没有线性关系,而相关性则强调两个变量之间存在线性关系。
  4. 独立性和相关性的关系强弱不同:独立性表示两个变量之间不存在任何关系,而相关性表示两个变量之间存在某种程度的线性关系。相关性可以进一步分为弱相关、中等相关和强相关。
    总之,独立性和相关性虽然都是描述变量关系的概念,但它们的定义、关系强弱以及应用场景有所不同。在进行数据分析时,我们需要根据实际问题和研究目的来判断应该关注哪一种关系。

2.条件概率与边缘概率

在这里插入图片描述

条件概率(Conditional Probability)和边缘概率(Marginal Probability)是概率论中的两个重要概念。

  1. 条件概率:在给定某些事件B已经发生的情况下,事件A发生的概率。在B发生的条件下A的概率,记作P(A|B)。计算公式为:P(A|B) = P(AB) / P(B)
    例如,假设抛掷一枚均匀的硬币,得到正面的概率为0.5,得到反面的概率也为0.5。现在假设已经抛掷了5次,其中3次得到正面,2次得到反面。那么,在已经抛掷5次,得到3次正面的条件下,下一次抛掷得到正面的概率是多少呢?根据条件概率的计算公式,可以得到P(A
    |B) = P(AB) / P(B),即0.5 / 0.5 = 1,表示下一次抛掷得到正面的概率是1。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值