- 博客(18)
- 收藏
- 关注
原创 【论文阅读】From Causal to Concept-BasedRepresentation Learning
为构建智能机器学习系统,现代表示学习致力于从数据中恢复潜在生成因子(例如因果表示学习领域的研究)。这一快速发展的领域中,一个核心问题是:需明确何种严格条件下,潜在因子可被识别(进而有望被学习)。基于线性表示与概念学习领域的大量实证研究,我们提出以几何化的概念定义来放宽因果相关假设。本文正式定义了 “概念” 的数学内涵,并通过严谨证明表明:此类概念可从多样化数据中可靠恢复。与对 “真实” 潜在生成空间施加假设不同,我们仅要求 “概念可在该潜在空间中线性表示”。
2025-09-10 19:47:08
325
原创 【论文阅读】Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs
在使用大语言模型(LLMs)处理复杂推理时,通常有两类方法:一类方法是通过提示 LLMs 使用各种推理结构,而这些结构化输出可以自然地被视为中间推理步骤;另一类方法是采用不依赖 LLM 的声明式求解器来完成推理任务,这类方法能带来更高的推理准确率,但由于求解器是黑箱,其推理过程缺乏可解释性。为了缓解答案准确率和可解释性之间的权衡,我们对第二类方法提出了一个简单扩展。具体来说,我们展示了 Prolog 解释器在搜索过程中生成的中间日志是可以被访问并进一步转化为人类可读的推理证明的。
2025-09-02 14:42:47
706
原创 【Googledrive大文件光速下载到Linux】最有用的一集
然而这一方法通常卡在1GB左右就不行了,这应该是multcloud的接口限制,因此需要给他分片下载。通过colab就可以完成这一步骤,正好都是谷歌软件,自洽了。用自己的googledrive 账号登录后,根据上面我贴的那个原文链接,可以从自己的盘里,也可以从别人share的盘里打开。跑深度学习任务的时候下载googledrive文件再scp要下好几天,gdown也不是很快。wget下来的默认名字是content?祝大家炼丹顺利,no bug no error!之后复制下载链接wget即可(细节看原文)。
2025-07-10 13:47:12
373
原创 【视频异常检测】Attention-guided generator with dual discriminator GAN for real-time video anomaly detection
在视频监控领域,检测视频中的异常情况是一项重大挑战。其主要目标是识别并检测视频序列中的不寻常行为或事件。难点在于异常情况的视频帧资料有限,而且异常的定义也不明确。基于生成对抗网络(GAN)的广泛应用(包括生成器和判别器网络),我们提出了一种基于注意力引导的双判别器生成对抗网络(A2D-GAN)用于实时视频异常检测(VAD)。生成器网络采用编码器-解码器架构,并在编码器中添加了多阶段自注意力机制,在解码器中添加了多阶段通道注意力机制。该框架通过对抗学习来自噪声的视频帧重建来增强生成器网络的泛化能力。
2025-06-28 12:50:46
555
原创 【视频异常检测】Old is Gold: Redefining the Adversarially Learned One-Class Classifier Training Paradigm
一种常见的异常检测方法是利用对抗网络的生成器来根据输入的重建损失计算异常得分。由于异常情况发生的频率极低,优化此类网络可能是一项繁琐的任务。另一种可能的方法是同时使用生成器和判别器来进行异常检测。然而,由于涉及对抗训练,这种模型往往在某种程度上不稳定,每次训练步骤的性能都会大幅波动。在本研究中,我们提出了一种框架,能够在广泛的训练步骤中有效地生成稳定的结果,并允许我们使用对抗模型的生成器和判别器来进行高效且稳健的异常检测。我们的方法将判别器的基本作用从区分真实和虚假数据转变为区分高质量和低质量的重建质量。
2025-06-25 15:03:39
945
原创 【视频异常检测】几篇预测+重建混合模型整理
视频异常检测(VAD)能够识别监控录像中偏离正常行为或物体的异常情况,例如斗殴、踩踏事件或交通事故等[1]。在公共区域(如十字路口、电梯、医院和银行)广泛部署视频监控对于保障生命和财产安全至关重要。因此,开发能够模拟人类理解能力的监测系统以区分正常和异常情况,并及时向监控区域内的人员通知异常情况,成为了研究的重点。目前,基于深度学习的方法[2]在视觉识别[3]、物体检测[4]、阴影检测与去除[5]以及视频异常检测[6,7]等多个领域都展现出了卓越的特征提取能力。
2025-06-25 08:59:21
940
原创 【视频异常检测】Interleaving OneClass and Weakly-Supervised Models with Adaptive Thresholding for ...
视频异常检测(VAD)在一类分类(OCC)和弱监督学习(WS)的框架下已得到了广泛研究,但这两者都需要耗费大量人力去标注正常/异常标签。在本文中,我们研究了无监督 VAD(UVAD),它不依赖任何标签,而是将 OCC 和 WS 结合到一个统一的训练框架中。具体而言,我们将 OCC 扩展为加权 OCC(wOCC),并提出了一个 wOCC-WS 交替训练模块,其中两个模型能够自动为对方生成伪标签。我们面临使这种结合有效的两个挑战:(1)由于伪标签不可避免的随机性,模型在训练过程中偶尔会出现性能波动。
2025-06-24 22:13:24
776
原创 【视频异常检测】Noise-Resistant Video Anomaly Detection via RGB Error-Guided Multiscale Predictive Coding...
由于背景噪声的干扰,现有的视频异常检测方法容易将复杂场景中的某些正常事件误判为异常事件。同时,我们注意到正常模式的多样性尚未得到充分考虑,即测试数据中值得参考的正常事件并未得到恰当利用,这增加了漏检和误检的风险。在本研究中,我们结合下一帧预测和预测帧重建的任务,提出了一种抗噪声的视频异常检测方法。对于预测任务,我们开发了一个基于RGB误差引导的多尺度预测编码(EG-MPC)框架,以克服背景噪声对不同尺度下物体外观和运动特征学习的干扰,从而实现高质量的帧预测。
2025-06-24 11:32:31
1275
原创 【视频异常检测】Video Anomaly Detection and Explanation via Large Language Models
视频异常检测(VAD)旨在识别视频序列中的异常事件。它在众多领域有着实际应用,包括智能制造[6]、交通监控[7, 14]和公共安全[16, 18]等。传统的 VAD 方法[13, 14, 18, 19, 24, 28]旨在根据视频的时间线预测异常分数,即每个视频帧对应一个异常分数。分数越高,表明该帧出现异常的可能性越大。这些基于异常分数的设计易于实现,但与 VAD 的理想模型仍有很大差距,理想模型应既自动(即无需手动选择阈值)又可解释(即能够解释为何某个事件是异常的)。
2025-06-23 11:06:35
829
原创 【视频异常检测】EventVAD: Training-Free Event-Aware Video Anomaly Detection
视频异常检测(VAD)旨在识别视频中的异常情况。有监督方法需要大量的同类域训练数据,并且往往难以将这些方法应用于未见过的异常情况。相比之下,无需训练的方法利用大型语言模型(LLM)的内在世界知识来检测异常情况,但它们在定位精细的视觉转换和多样事件方面面临挑战。因此,我们提出了 EventVAD,这是一个事件感知的视频异常检测框架,它通过时间-事件推理将定制的动态图架构和多模态 LLM 结合在一起。具体而言,EventVAD 首先使用具有时间衰减约束的动态时空图模型来捕捉事件感知的视频特征。
2025-06-23 09:56:37
1216
原创 【论文阅读】Verbalized machine learning: Revisiting machine learning with language models.
受大型语言模型(LLM)发展的影响,我们引入了“言语化机器学习”(VML)这一框架。与传统机器学习(ML)模型通常在连续上进行优化不同,VML 将参数空间限制为人类可理解的。这种约束带来了函数逼近的新视角,即带有文本提示的 LLM 可以被视为由文本提示参数化的函数。基于这一视角,我们重新审视了经典的机器学习问题,如回归和分类,并发现这些问题可以通过 LLM 参数化的学习器和优化器来解决。
2025-06-22 11:55:07
1182
1
原创 【视频异常检测】Making Anomalies More Anomalous: Video Anomaly Detection Using a Novel Generator and Destroy
我们提出了一种用于视频异常检测的新方法。现有的视频异常检测方法仅对正常帧进行训练,期望通过异常帧质量下降这一特性,并利用与真实数据的重建误差来检测异常。然而,由于深度神经网络具有强大的泛化能力,它们往往能够熟练地生成异常帧,这给异常检测带来了挑战。为解决这一问题,我们引入了一种新方法:通过破坏异常帧中的异常区域,使异常特征更加突出。为此,我们提出了帧到标签与运动(F2LM)生成器和破坏器(Destroyer)。F2LM生成器利用输入帧的标签和运动信息预测未来帧,从而降低异常区域的质量;
2025-06-16 09:51:00
996
原创 【视频异常检测】Self-supervised spatiotemporal representation learning by exploiting video continuity
近期的自监督视频表示学习方法通过探索视频的某些关键特性(如速度、时间顺序等)取得了显著成效。本研究则利用了视频中一个重要但尚未充分开发的特性——视频的连续性,以获取用于自监督表示学习的监督信号。具体而言,我们提出了三个与连续性相关的预训练任务,即连续性证明、不连续性定位和缺失部分近似,这些任务共同对共享的骨干网络进行监督,以进行视频表示学习。这种自监督方法被称为连续感知网络(CPNet),它综合解决了这三个任务,并促使骨干网络学习局部和长距离的运动及上下文表示。
2025-06-15 16:25:26
672
原创 【缺陷检测】Towards Total Recall in Industrial Anomaly Detection
能够识别出有缺陷的部件是大规模工业制造中至关重要的一环。在本研究中,我们所解决的一个特定难题是冷启动问题:仅使用名义(无缺陷)的示例图像来训练模型。虽然针对每个类别的手工解决方案是可行的,但我们的目标是构建能够自动同时在许多不同任务上表现良好的系统。表现最佳的方法是将 ImageNet 模型的嵌入与异常检测模型相结合。在本文中,我们沿着这一研究方向进行了扩展,并提出了 PatchCore,它使用了一个由名义的局部特征组成的最具代表性的记忆库。
2025-06-12 14:35:17
815
原创 【视频异常检测】Dynamic Local Aggregation Network with Adaptive Clusterer for Anomaly Detection
基于记忆增强自编码器(memory-based AE)的现有异常检测方法存在以下缺陷:(1)建立记忆库需要额外的存储空间。(2)基于主观假设的固定数量原型忽略了数据特征的差异性和多样性。为了克服这些缺陷,我们引入了 DLAN-AC,这是一种具有自适应聚类器的动态局部聚合网络,用于异常检测。首先,所提出的 DLAN 能够自动从 AE 中学习并聚合高级特征,以获得更具代表性的原型,同时释放额外的存储空间。其次,所提出的 AC 能够根据先验信息自适应地对视频数据进行聚类,以获得初始原型。
2025-06-11 13:10:24
723
原创 【视频异常检测】VAU-R1: Advancing Video Anomaly Understanding via Reinforcement Fine-Tuning
视频异常理解(VAU)对于诸如智慧城市、安全监控和灾难预警系统等应用而言至关重要,但其在处理模糊情况下的精细时空感知和稳健推理方面仍颇具挑战性。尽管在异常检测方面取得了进展,但现有的方法往往缺乏可解释性,并且难以捕捉异常事件的因果和上下文方面的内容。这一局限性因缺乏用于评估异常场景推理能力的全面基准而变得更加严重。为了解决这两个挑战,我们引入了 VAU-R1,这是一个基于多模态大型语言模型(MLLM)的数据高效框架,通过强化微调(RFT)来增强异常推理能力。
2025-06-10 10:23:26
771
原创 【视频异常检测】论文阅读 VAD + Diffusion Model
Safeguarding Sustainable Cities: Unsupervised Video Anomaly Detection through Diffusion-based Latent Pattern LearningIJCAI2024摘要:可持续城市需要高质量的社区管理和监控分析,而这些都需要借助视频异常检测技术的支持。然而,主流的视频异常检测技术仍然需要人工标注的数据,并且不适用于现实世界中的大量视频。如果没有标注,(unsupervised video anomaly detectio
2025-06-06 15:44:48
1259
1
原创 【视频异常检测】论文阅读 Unsupervised VAD
Deep anomaly discovery from unlabeled videos via normality advantage and self-paced refinementCVPR2022摘要:传统的视频异常检测(VAD)需要有标注的正常视频(OCC)来进行训练,而新兴的无监督Unsupervised VAD(UVAD)则旨在直接从完全未标注的视频中发现异常。然而,现有的 UVAD 方法仍然依赖于浅层模型来进行检测或初始化,它们显然不如经典的 VAD 方法有效。本文提出了一种基于全深度神经网
2025-05-31 11:28:35
885
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅