自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【聚类】文本表示——文本特征提取

TF即词频,指某个词t在文档d中出现的次数。公式如下其中分母表示文档d中所有词的总词频IDF即逆文档频率,用于衡量词t的重要性。某个词出现得越广泛,其区分能力越弱,权重也越低。公式如下:其中N是文档总数,n(t)是包含词t的文档总数,加1是为了避免分母为0的情况TF-IDF:这意味着某个词在一篇文档中的最终权重由其在文档中的频率和该词的稀有程度共同决定。

2024-12-13 00:12:19 1241

原创 “基于LGMD的视觉神经网络用于检测人群逃逸行为”代码复现

该论文基于果蝇视觉神经系统,提出了一种基于LGMD(Lobula Giant Movement Detector,果蝇大叶运动检测器)模型的视觉神经网络,用于检测人群中的逃生行为。论文内容涉及神经网络的生物启发式设计、异常检测的性能评估,以及该方法在实际场景中的应用潜力。注意:在此我们仅仅只对模型做简单的介绍,主要是分享复现后的代码和相应用到的数据集,以供有需要的人学习使用。给定一个亮度变化的阈值Tp,对应按照公式处理Pf的值,低于阈值的直接改为0。我们复现所得到的图像曲线与原论文中得到的基本一致!

2024-11-29 14:51:28 448 2

原创 多视图聚类【MFLVC】2022 CVPR

由于视图特有信息的干扰,某些视图中的聚类标签可能不一致。首先,通过自编码器得到的特征包含了每个视图的公共语义和视图特有的信息,这些被称为“低级特征”。:这是指通过最小化不同视图之间的特征距离来确保各视图间的表示一致,旨在提取各视图中相同或共享的语义信息。对比学习通过公式(3)中的损失函数来实现,即将正样本对的相似度最大化,负样本对的相似度最小化,从而让高级特征 主要关注各视图中的公共语义信息。:MFLVC避免直接融合各视图的特征,而是对每个视图构建单独的特征学习模型,以减少视图特有信息对聚类的干扰。

2024-11-15 10:42:43 652

原创 基础深度聚类算法——DEC与SDEC

在DEC论文中,聚类过程通过KL散度(Kullback-Leibler Divergence)来优化,并涉及一个非线性映射和一组初始聚类中心。整个过程是一个迭代的无监督学习算法,交替执行步骤,直至满足收敛条件。(1)soft assignment软分配计算论文中详细解释了软分配(Soft Assignment)的计算方法,该方法基于Maaten和Hinton(2008)的研究。软分配是一种衡量嵌入点与聚类中心之间相似度的方法,允许一个样本属于多个聚类的概率分布。具体计算步骤如下:·计算距离。

2024-11-12 21:02:01 1166

原创 SDCN & barlow twins的结合尝试实验

模型整体框架图如下所示其中,上部分为GCN模型,下部分为DNN模型有关KNN graph的计算如下分别用于计算连续属性和离散属性的相似性值。

2024-11-06 12:56:21 325

原创 数字视频处理分析——运动估计

属于在静态背景下的目标检测方法,是实现运动估计的一种简单而直观的方法,主要基于连续帧之间的像素强度变化。差分法的核心思想是通过比较连续两帧或多帧图像之间的像素差异来估计运动。如果一个像素在连续的帧之间有显著的变化,那么可以推断该位置发生了运动。

2024-03-11 20:16:20 2525

原创 数字图像处理与分析

颜色聚合向量(Color Coherence Vector, CCV),不仅考虑了颜色的分布(像传统的颜色直方图那样),还考虑了颜色的空间一致性,即颜色在图像中的空间连接性。它显示了每个像素值(或像素值的范围)在图像中出现的频率。本质是关于图像特征的概率分布,因此灰度图像的一般特征直方图就是图像中各像素的灰度值在灰度空间的概率分布。在颜色图像的上下文中,颜色矩是指对颜色值(如RGB颜色空间中的R、G、B分量)进行计算得到的矩。直方图的每一维对应一个特定的LBP值,直方图的值是具有该LBP值的像素数量。

2024-02-01 15:21:29 1217

原创 简单的深度学习模型の具体代码

手写数字识别是计算机视觉中的一个重要任务,它涉及识别和分类手写数字的图像。我们将使用PyTorch库来构建一个深度神经网络,该网络可以学习如何识别0到9的手写数字。

2024-01-26 17:12:56 1483

原创 数字图像转换与噪声处理

膨胀运算(Dilation)是图像形态学处理中的一种基本操作,用于扩张图像中的对象或特定区域。膨胀运算与腐蚀运算相反,膨胀运算(Dilation)是图像形态学处理中的一种基本操作,用于扩张图像中的对象或特定区域。一般来说,选择的模板窗口越大,图像滤波后边缘就会越模糊,常见模板为3x3和5x5。图像中每个像素点处与 模板匹配的邻域中各点的像素值 与模板中对应点的值进行加权平均,并用加权平均后的值代替原像素点的值。在笛卡尔坐标系下,原点位置表示黑色,白色位于其对角线另一端,黑白两点的连线表示着灰度等级的变化。

2024-01-14 19:18:54 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除