- 博客(21)
- 收藏
- 关注
原创 Identification loss(身份损失) 和 Triplet Loss(三元组损失)
解释了reid中最常见的两种损失,ID loss 和 triple loss
2024-10-24 17:16:01
336
原创 在occluded Person Re-ID中,选择clip还是ViT作为backbone?
CLIP是OpenAI提出的一种模型,旨在通过对大规模的图像和文本数据进行对比学习,实现图像和文本的相互理解。CLIP模型包含了一个图像编码器和一个文本编码器,通过对比学习(contrastive learning)方法训练,使得图像和文本在同一个向量空间中能够很好地对应。
2024-07-28 14:52:35
779
原创 深度学习中的backbone,neck和head是什么?
Backbone:提取输入图像的特征(如 VGG、ResNet)。Neck:对特征进行进一步处理和融合(如 FPN、PANet)。Head:根据具体任务生成最终的预测结果(如分类头、检测头、分割头)。这三个部分紧密结合,组成了一个完整的深度学习模型,每个部分的设计和选择都会影响模型的性能和适用场景。
2024-07-25 15:04:02
1679
2
原创 Person Re-Identification(Re-ID)的分类
整体行人重识别是最基础和标准的行人重识别任务。其假设行人在图像中的全身是清晰可见的,没有被遮挡或部分缺失。目标是通过行人的全身图像来进行识别。局部行人重识别指在图像中只有行人的部分可见,而非整个身体。这种情况常见于行人被部分遮挡、图像裁剪或行人位于图像边缘等情况。遮挡行人重识别是指行人在图像中被其他物体或行人部分遮挡的情况。这种情况在现实场景中非常常见,如行人被树木、车辆或其他行人挡住。整体行人重识别、局部行人重识别和遮挡行人重识别是行人重识别任务中的不同场景。
2024-07-23 14:40:19
875
原创 如何理解深度学习中的 metric learning(度量学习)?
Metric learning(度量学习)是机器学习和深度学习中的一个领域,其目标是通过学习一个映射函数,将数据点映射到一个新的空间中,使得在该空间中,相似的数据点距离较近,而不相似的数据点距离较远。度量学习广泛应用于图像检索、人脸识别、语音识别等任务。
2024-07-16 13:40:36
1662
原创 如何理解Embedding?
Embedding是一种强大的技术,它通过将离散的、高维的数据转换为连续的、低维的向量,使得模型能够更有效地处理这些数据。通过学习得到的嵌入向量能够捕捉到数据之间的复杂关系和相似性,从而在各种任务,尤其是自然语言处理任务中,发挥重要作用。
2024-07-10 14:31:59
571
原创 RE-ID中的CMC、mAP、recall、precision、ACC
mAP更好地反映了所有正确的目标图片在排序列表顶部的程度。与CMC曲线相比,它可以更全面地衡量Re-ID算法的性能,它反映了模型在单一类别上的工作效果,是每个正确预测的准确率的平均值。它反映了输出中正确样本的准确性。
2024-07-02 13:49:00
368
1
原创 LSTM(长短期记忆)
遗忘门在LSTM中的作用是通过控制细胞状态中的记忆,选择性地遗忘不必要的信息,处理长期依赖关系,动态调整网络的记忆状态,以及减少梯度消失问题,从而提高了网络对时间序列数据的学习和记忆能力。这有助于网络更好地学习和记忆关键模式和特征。4. 适应不同时间步的输入:输入门根据每个时间步的输入数据动态调整,这使得LSTM网络能够灵活地适应不同时间步的输入模式和特征,提高了网络的泛化。输出门在LSTM中的作用是控制细胞状态对隐藏状态的输出程度,处理长期依赖关系,动态调整网络的输出状态,以及产生最终的预测或输出结果。
2024-04-14 10:49:41
2278
1
原创 VMD(变分模态分解)
VMD,全称是变分模态分解,是一种用来分离非固定频率信号的方法。其原理源于信号处理中的固定频率信号大小不固定的问题。②在任意点,由局部最大值定义的信号包络线和由局部最小值定义的信号包络线的均值为零。VMD是一个非线性和自适应的过程,它利用一种迭代过程,通过将数据分解为更简单的、频率固定的信号,然后进行合并和过滤,从而实现信号的高质量重建。3.通过对解调信号梯度的L2正则化进行高斯 平滑估计,得到每个光伏分量的带宽。2.通过混合一个调至各自估计中心频率的指 数,将各光伏分量的频谱转移到基带区域。
2024-04-14 10:43:08
6648
1
原创 编译原理-计算机考研面试(复试)问题---个人总结2
实现多态时,根据对象的实际类型查找其对应的虚函数表,然后调用相应的虚函数,这个过程可能在编译时完成,也可能在运行时完成。** 答案:优化是编译流程的一个步骤,其目的在于改进编译器产生的代码,使得改进后的代码消耗更少的资源,如运行更快或占用更少的内存空间。** 答案:指令调度是编译器中的代码生成阶段的一个环节,目的是重排一组指令的执行顺序,来避免处理器流水线的停顿,并提高执行效率。** 答案:符号表是编译器用来收集关于源程序的语义信息的数据结构,如变量名、函数名、常量名等,以及它们的类型,范围,内存位置等。
2024-03-26 10:16:30
1427
3
原创 计算机考研复试---编译原理(部分)--仅用于我自学
静态多态(编译时多态)是在编译时确定函数的调用地址,通过函数的名称和参数类型来选择正确的函数。编译器在编译阶段根据参数的类型和数量来确定要调用的函数,这种多态性是在编译时静态决定的。答案:前端优化是指在源代码级别上进行的优化,包括对算法和数据结构的改进,而后端优化是在生成的中间代码或目标代码上进行的优化,包括指令选择、寄存器分配和代码调度等。答案:遮蔽指的是在作用域中使用同名标识符来隐藏外部作用域中的标识符,而同名覆盖是在继承的情况下,在派生类中使用与基类中相同名称的成员函数或变量来覆盖基类的成员。
2024-03-20 21:59:00
1013
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人