系列文章目录
文章目录
- 系列文章目录
- 一、 P ( Y ∣ X ) = ∑ z P ( Y , z ∣ X ) = ∑ z P ( Y ∣ X , z ) P ( z ∣ X ) ‾ P(Y|X)=\sum_{z}P(Y,z|X)=\sum_{z}P(Y|X,z)\underline{P(z|X)} P(Y∣X)=∑zP(Y,z∣X)=∑zP(Y∣X,z)P(z∣X)这个公式怎么推导
- 二、怎么在论文中理解上述公式
- 三、对上面内容简单举例
- 四、There are usually some meta data (tag entities) about the product, such as brand and category, which represents domain-specific knowledge.在深度学习领域怎么解释
- 五、However, the popular Region of Interest (RoI)[11] based methods detect unsatisfactory region proposals with either repeated object regions or irrelevant subregions to the product.什么意思
- 六、举个简单带简单计算的例子,在图像分类领域的因果关系的例子
- 七、Such out-of-distribution problem in multimodal finetuning is recently studied from the causal inference viewpoint [67]. Zhang et al. formulate this undesirable spurious correlations between image and language as “confounders” learned from the pretrained dataset.什么意思?
- 八、在训练集上学到的无关特征 什么意思 举个例子
- 九、However, when modeling the confounding variables, Zhang et al. follow the traditional BERT token vocabulary, treating each entity as a group of (sub)word tokens as others [10, 72]. This overlooks a large collection of special meaning entities in e-commerce, such as “Dissel (brand)”,“top (category)”, “relexed (fit)”. Moreover, this will inevitably intertwine different entities with the shared confounding (sub)word tokens, such as “Canada Goose” and “Golden Goose”. To this end, the language part should be entity-aware [31, 47, 71] and disentangled from the conventional meanings of special entities encoded in the pretrained language model.什么意思
- 十、这种做法忽视了电子商务中许多具有特殊含义的实体 是怎么被忽略的 举个例子
- 十一、此外,这种方法不可避免地将不同的实体与共享的混杂(子)词令牌交织在一起,例如“Canada Goose”和“Golden Goose”。 是怎么交织的,举个例子
- 十二、研究者们从因果推断的角度探讨了“分布外问题”。什么叫分布外问题,举个例子
- By modeling with structural causal model (SCM) graph [36], the authors perform hard intervention to remove the dataset bias via backdoor intervention [36].怎么理解
- 研究背景
- 相关工作
- 论文贡献
- 方法框架
- 研究思路
- 实验
- 限制
一、 P ( Y ∣ X ) = ∑ z P ( Y , z ∣ X ) = ∑ z P ( Y ∣ X , z ) P ( z ∣ X ) ‾ P(Y|X)=\sum_{z}P(Y,z|X)=\sum_{z}P(Y|X,z)\underline{P(z|X)} P(Y∣X)=∑zP(Y,z∣X)=∑zP(Y∣X,z)P(z∣X)这个公式怎么推导
要推导公式
P ( Y ∣ X ) = ∑ z P ( Y , z ∣ X ) = ∑ z P ( Y ∣ X , z ) P ( z ∣ X ) ‾ ( 1 ) P(Y|X) = \sum_{z} P(Y, z|X) = \sum_{z} P(Y|X, z) \underline{P(z|X)} \quad (1) P(Y∣X)=∑zP(Y,z∣X)=∑zP(Y∣X,z)P(z∣X)(1)
我们可以使用全概率公式和条件概率的定义来进行推导。
- 条件概率的定义:
条件概率 (P(Y|X)) 表示在给定 (X) 的情况下 (Y) 发生的概率。根据条件概率的定义,我们有:
P ( Y ∣ X ) = P ( Y , X ) P ( X ) P(Y|X) = \frac{P(Y, X)}{P(X)} P(Y∣X)=P(X)P(Y,X)
但是我们需要引入一个隐变量 (z) 来进行分解。
- 全概率公式:
根据全概率公式,我们可以将 (P(Y|X)) 表达为对所有可能的 (z) 的求和:
P ( Y ∣ X ) = ∑ z P ( Y , z ∣ X ) P(Y|X) = \sum_{z} P(Y, z|X) P(Y∣X)=∑zP(Y,z∣X)
这里的 (P(Y, z|X)) 是在给定 (X) 的情况下 (Y) 和 (z) 同时发生的概率。
- 条件概率的乘法法则:
根据条件概率的乘法法则,我们可以将 (P(Y, z|X)) 进一步分解为:
P ( Y , z ∣ X ) = P ( Y ∣ X , z ) P ( z ∣ X ) P(Y, z|X) = P(Y|X, z) P(z|X) P(Y,z∣X)