自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 解决高维观测数据(特别是图像数据)的反事实估计-Diffusion Causal Models for Counterfactual Estimation_文章解读分享

这篇文章提出了一种名为Diff-SCM的深度结构因果模型,旨在解决高维观测数据(特别是图像数据)的反事实估计这一开放性挑战。研究的核心在于,即使在已知因果结构的情况下,如何利用神经网络量化干预措施的因果效应。Diff-SCM通过结合生成式能量模型(特别是扩散模型)的最新进展,并利用因果模型所蕴含的边际和条件分布的梯度进行迭代采样来完成推理。其反事实估计过程首先通过确定性前向扩散推断潜在变量,然后利用反因果预测器相对于输入的梯度,在逆向扩散过程中进行干预。此外,论文还提出了一种评估生成反事实的新指标。

2025-09-18 20:14:56 1316

原创 Challenges in Statistics: A Dozen Challenges in Causality and Causal Inference_文章解读

最近,一篇由Carlos Cinelli等著名学者共同撰写的论文《Challenges in Statistics: A Dozen Challenges in Causality and Causal Inference》(《统计学中的挑战:因果关系与因果推断的十二大挑战》)为我们描绘了这个领域当前面临的困境和未来的发展方向。这篇博文将以最通俗易懂的方式,带您领略因果推断的奥秘,以及它在未来几十年将如何塑造我们的世界。

2025-09-17 17:29:20 1187

原创 OOD推荐系统-Distributionally Robust Graph Out-of-Distribution Recommendation via Diffusion Model解读

本文探讨了推荐系统中的分布偏移(OOD)问题,并提出了一种新型分布鲁棒图模型(DRGO)。传统基于图神经网络(GNN)的推荐系统依赖独立同分布(IID)假设,但在实际应用中常因用户习惯变化、政策调整等因素导致性能下降。DRGO创新性地结合扩散模型进行去噪处理,采用Sinkhorn距离替代KL散度构建不确定集,并引入熵正则化项抑制噪声样本影响。理论分析证明了DRGO的泛化误差界,实验验证其在多种分布偏移场景下的优越性能。该研究为提升推荐系统的鲁棒性和泛化能力提供了新思路。

2025-09-16 21:56:53 1292

原创 揭秘机器学习中的不确定性:偶然与认知的双重奏- Aleatoric and epistemic uncertainty in machine learning 文章解读

告别AI“自信的错误”:揭秘机器学习两大不确定性,打造真正可信赖的智能系统!在自动驾驶事故频发、医疗诊断容错率为零的今天,你是否曾思考过,为什么AI有时会“自信地犯错”?为什么它给出的50%降雨概率,有时是天气本身就多变,有时却是预报员一无所知?这篇深度剖析的文章解读将带你走进机器学习不确定性的核心世界,揭开长久以来被忽视的 “偶然不确定性”(Aleatoric Uncertainty) 和 “认知不确定性”(Epistemic Uncertainty) 的神秘面纱。

2025-09-15 09:29:30 1297

原创 DT3OR:Dual Test-time Training for Out-of-distribution Recommender System——让推荐系统在“数据变了”时也能精准推荐

LLdαLcLLd​αLc​这里α是平衡两个损失的参数,比如α=1就是两者 equally important。不用重新训练:在推荐的时候(测试阶段)就能自己调整,省时间省算力;抓得准又能适应:既记住用户不变的喜好(比如爱吃辣),又能适应新变化(比如冬天爱吃辣火锅);通用好用:不管是美团、Yelp还是Steam,各种推荐场景都能用。

2025-09-05 16:23:43 1023

原创 文章解读:Dynamic Graph Information Bottleneck(DGIB)

这篇提出了一种增强动态图神经网络(DGNNs)抗攻击能力的方法。针对现有DGNNs在结构攻击和特征攻击下鲁棒性差的问题,作者改进了信息瓶颈(IB)理论,提出动态图信息瓶颈(DGIB)框架,通过"最小-充分-一致"条件学习抗干扰的节点表示。DGIB将优化目标分解为两个通道:DGIB_MS保证表示的信息充分且最小化冗余,DGIB_C确保时间维度上的预测一致性。

2025-09-04 15:31:33 1062

原创 ABCOR :Attention-based causal representation learning for out-of-distribution recommendation 文章解读

本文提出注意力机制驱动的因果分布外推荐框架ABCOR,解决传统因果OOD推荐框架(如COR)忽略潜在用户特征偏移和偏好间关联的问题。ABCOR通过变分注意力分析潜在用户特征偏移优化交互生成,利用多头自注意力层挖掘用户偏好关联提升预测准确性。在Meituan和Yelp数据集上的实验表明,ABCOR在Recall@K和NDCG@K指标上显著优于COR等模型(如Meituan数据集R@50提升26.63%)。消融实验验证了变分注意力、多头自注意力层及反事实推理的关键作用。ABCOR对时序类偏移(如消费周期)的捕捉

2025-09-04 14:26:16 1024

原创 Environment-Aware Dynamic Graph Learning for Out-of-Distribution Generalization 文章解读

文章摘要 EAGLE框架首次从环境学习视角解决动态图分布外(OOD)泛化问题。针对现有动态图神经网络(DGNNs)依赖I.I.D.假设、易捕获虚假关联的缺陷,该框架通过四大核心模块实现突破:1)环境感知EA-DGNN建模潜在环境;2)ECVAE生成多样化环境样本;3)动态规划识别时空不变模式;4)节点级因果干预消除虚假关联。在COLLAB、Yelp和ACT三个真实数据集上的实验表明,EAGLE在链接属性偏移和节点特征偏移场景下的AUC指标显著优于静态GNN、动态GNN及OOD方法,如COLLAB的OOD场景

2025-09-01 15:17:53 582

原创 扩散模型条件注入全解析:从数学原理到落地实践

本文系统分析了扩散模型中三种主流条件注入方法:分类器引导(双模型协作)、无分类器引导(CFG单模型方案)和简单手动引导(规则驱动)。从数学原理、实现细节到落地特性进行对比,重点阐释了CFG通过线性组合有条件/无条件输出来放大条件影响的核心机制。文章提供了动态引导强度调整等优化技巧,并总结选型指南:高精准需求用分类器引导,通用场景推荐CFG,快速原型可采用简单手动引导。各类方法在计算成本、控制强度和风险上存在显著差异,需根据实际需求权衡选择。

2025-08-27 18:08:58 474

原创 扩散模型三种主流条件注入解析:从数学原理到落地实践

本文系统解析了扩散模型中三种条件注入方法:分类器引导(依赖外部模型,控制强但成本高)、无分类器引导(CFG,单模型灵活高效,当前主流)、手动引导(规则驱动,轻量但鲁棒性差)。通过数学原理、直观解读和落地对比,提供选型指南:高精度选分类器,通用场景用CFG,快速原型用手动。文章还给出动态调整权重、多模态融合等优化技巧及常见问题解决方案,强调实际应用中常需组合不同方法,以实现效果与成本的平衡。

2025-08-27 17:44:38 1167

原创 无监督机器学习聚类算法-K-均值(K-means)

K-均值(K-means)是一种经典的无监督机器学习聚类算法,由MacQueen于1967年首次提出[1]。该算法旨在将包含n个数据点的数据集= {₁,₂, ...,}划分成K个不相交的簇= {C₁, C₂, ..., Cₖ},使得簇内平方和(Within-Cluster Sum of Squares, WCSS)最小化。

2025-06-26 19:42:04 830

原创 自然语言处理(NLP)

自然语言处理(NLP)技术其实就是让电脑能够"读懂"和"理解"我们人类的语言。

2025-06-26 19:39:35 423

原创 Cursor黑科技——AI编程非常实用

开发者如何有效融入AI编程工作流技术边界的认知与合理预期管理资源获取与社区支持途径该大纲保持技术深度同时兼顾可读性,每个章节均可独立扩展为实战案例解析。实际写作时可加入具体语言示例、性能测试数据及典型错误处理场景。

2025-06-26 19:35:34 355

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除