CVPR 2024 | Open-Vocabulary Video Anomaly Detection
这篇文章主要研究了开放词汇视频异常检测(openvocabulary video anomaly detection,OVVAD)的问题,这是一个具有挑战性但实际重要的问题。实验结果表明,该模型在三个公开基准 UBnormal,UCF-Crime,XD-Violence 上优于现有方法,特别是在处理新类别时表现出明显的优势。利用语言图像预训练模型,如 CLIP 作为基础,得益于其强大的零样本泛化能力。,以更好地处理开放词汇视频异常检测问题。并引入了几个专用模块来促进对基线和新异常的检测。
原创
2024-04-11 12:59:57 ·
1655 阅读 ·
0 评论