自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 github上传代码

参考资料。

2024-06-06 23:59:45 259

原创 【文章摘要-20231019】Any-to-Any Generation via Composable Diffusion

代码链接作者提出了一个可组合的扩散模型,该模型体现为能够处理任何输入模态的组合,进而输出任何模态组合的新型生成模型,如语言、图像、视频或音频。不同于已经存在的生成式人工智能系统,该算法能够并行生成多个模态并且他的输出不仅限于图像或文本这种子集。尽管对于许多模态的组合训练集是缺乏的,作者提出同时在输出和输入空间对齐多个模态。这使得该算法能够自由调节任何输入模态的结合并生成任何模态的组合,即使在数据训练数据中没有体现。

2023-10-19 18:19:21 338

原创 【文章摘要-20230523】Self-Learning Symmetric Multi-view ProbabilisticClustering

然后,SLS-MPC提出了一种新的无先验知识和超参数的自学习概率函数,从单视图、交叉视图和多视图的一致性方面学习每个视角的独立分布。接下来,使用具有路径传播和联合近邻传播的图上下文感知细化来改善成对的概率,这减轻了噪声和异常值的影响。在本文中,作者提出了一个新的统一框架用于不完整和完整的多视角聚类任务,称为自学习对称多视角概率聚类(SLS-MPC)。SLS-MPC提出了一种新的对称多视角概率估计,并将多视图成对后验匹配概率等效地转换为每个视角的个体分布的组合,该组合容忍数据丢失并可以扩展到任何数量的视角。

2023-05-23 17:36:26 163

原创 【文章摘要-20230509】Adaptively Topological Tensor Network for Multi-view Subspace Clustering

为了缓解以上提到的限制,作者提出了自适应的拓扑张量网络,该网络通过自表示张量的结构信息确定边缘秩(新名词),该方法能够基于数据驱动策略提供更好的张量表示。特别的,在多视角张量聚类方面,作者分析了不同自表示张量的不同模态之间的高阶相关性,并从一个全连接张量网络精简弱相关性的链接。因此,获取的新张量网络能够有效的从不同数据集中探索具有不同张量结构的自表示潜在聚类信息。因此,一个预先定义的张量分解可能无法充分利用一个特定数据集的低秩信息,这会导致多视角聚类取得次优的性能。

2023-05-09 14:38:12 196

原创 【文章摘要-20230427】Subspace-Contrastive Multi-View Clustering

特别地,SCMC采用特殊视角的自动编码方法映射原始多视角数据到保存非线性结构的紧凑特征中。考虑到不同模态存在的海量语义鸿沟,作者应用子空间学习来统一多视角数据至一个联合的语义空间中,即嵌入的紧凑特征通过多个子表示层分别学习子空间表示。为了提升判别性并挖掘多个子空间表示的互补性,作者采用对比策略最大化positive样本对之间的相似度并区分negative样本对。为了证明所提模型的有效性,作者在8个数据集做实验,结果表明所提方法由于已存在的浅层和深度多视角聚类算法。摘要:大部分多视角聚类方法受到了。

2023-04-28 11:04:58 177

原创 【文章摘要-20230426】Hyper-Laplacian Regularized Concept Factorization in Low-rank Tensor Space for Multi-

考虑到到不同的张量奇异值与不同重要性的结构信息相关联,作者提出了自权重张量Schatten p范数来约束所有聚类表示组成的张量。值得注意的是,相同大小的张量在地址优化中极大的减少了时间和空间复杂度。基于自表示的张量子空间学习通常引发了较高的耗时和空间复杂度,并且在嵌入空间中的非线性结构的感知方面具有局限性。特别而言,作者采用了概念分解的方法去探索每个视角潜在的聚类表示。摘要:面向张量的多视角子空间聚类在多视角数据的高阶相关性评估和改善聚类分析方面收获了显著的进展。不同奇异值设置不同的重要性。

2023-04-26 10:19:19 236 1

原创 【文章摘要-20230425】Learning Robust Visual-Semantic Embeddingfor Generalizable Person Re-identification

为了进一步的提升在transformer的上下文中学习鲁邦的特征,作者引入了一个动态的掩码机制(MMM)去同时掩盖图像的块和文本的tokens,这种模块能够联合的协作在多模态或统一模态中并明显的提升行人重识别的泛化性能。可泛化的行人重识别任务是在机器学习和计算机视觉领域是一个非常热门的研究,由于它在公共安全和视频监控中的多方面应用,进而在现实场景汇总扮演了至关重要的角色。然而,之前的重识别方法主要关注视觉表示学习而在训练过程中忽略了探索潜在的语义特征,这将会导致模型在适应新的域时不具有泛化性。

2023-04-25 09:44:05 247

原创 【文章摘要-20230424】Multi-View Clustering via Semi-non-negativeTensor Factorization

最新论文摘要翻译

2023-04-24 11:24:10 221

原创 【论文阅读】Cascade Transformers for End-to-End Person Search

论文阅读 Cascade Transformers for End-to-End Person Search

2022-09-26 17:03:05 1289 2

原创 【论文阅读】Anchor-Free Person Search

行人搜索结合了检测和重识别任务,通过定位及识别真实环境获取的图像进行人员搜索。作者提出了 Feature-Aligned Person Search Network (AlignPS) 采用特征聚合模块(aligned feature aggregation module)用于行人搜索任务。......

2022-08-02 16:29:21 1272 1

原创 Endnote编辑参考文献

基于国家标准的 EndNote 输出样式模板 - 优源博客 | YouYuan Blog模板,在安装后双击,将该模板添加到style中。Endnote文献插入和格式修改 - 知乎不读取参考文献改endnote import

2022-03-09 19:20:20 163

原创 【论文阅读】TransReID: Transformer-based Object Re-Identification

论文代码链接论文原文链接摘要目标重识别的关键就是提取鲁棒的特征!之前方法的弊端:卷积神经网络(CNN)的方法一次只处理一个局部邻域,并且由于卷积和下采样算子(如池化和跨卷积)导致细节信息丢失。提出:纯基于transformer的目标ReID框架。具体来说:我们首先将图像编码为一系列补丁,并通过一些关键改进构建基于transformer的强baseline,这在使用基于cnn的方法的几个ReID基准上取得了有竞争力的结果。为了进一步增强transformer背景下特征学习,设计了两个新的.

2021-12-28 11:00:07 2948

原创 YOLOV4流程图(方便理解)

最近接触了目标检测相关算法,因此总结模型图便于理解和后续改进。

2021-11-26 15:07:48 2364 8

原创 pytorch学习-没掌握的点

Python.__getitem__方法python中的函数式编程函数compose一文弄懂Pytorch的DataLoader, DataSet, Sampler之间的关系

2021-07-18 17:02:18 158

原创 latex-写论文时一些常用设置

表格出现中文的时候文章中字体的设置\mathcal{F}花体字母\vbox{}空一行\noindent 不缩进\textcolor{red}{ } 颜色

2021-04-28 16:41:17 279

原创 审稿意见回复

审稿意见回复审稿意见回复写论文神器

2021-04-13 09:50:34 241

原创 【论文阅读】Multi-View Spectral Clustering with Optimal Neighborhood Laplacian Matrix

问题:现有的方法通常将一组预先指定的一阶拉普拉斯矩阵线性组合来构造最优的拉普拉斯矩阵,导致其表达能力有限,信息挖掘不足。解决:该算法同时的通过搜索一阶基和高阶基的线性组合的邻域来生成最优拉普拉斯矩阵该设计增强了最优拉普拉斯算子的表示能力,更好地利用了隐藏的高阶连接信息,提高了聚类性能。第三类方法是通过极小化来优化基拉普拉斯矩阵的组合系数组合矩阵的标准化切割缺点:首先,这些算法都有一个共同的假设,即最优拉普拉斯矩阵位于由基拉普拉斯矩阵张成的线性空间中。现有算法没有充分考虑高阶亲和度信息,这对揭

2020-12-22 22:02:28 599

原创 【代码学习】

运行代码的时候发现,data中的内容和sampler中的差不多,因此看看之间的差异sampler的解释pinmemory 锁存,在内存比较丰富的环境下可以true

2020-11-27 08:45:50 234

原创 ConnectionRefusedError: [Errno 111] Connection refused问题解决

解决方法一same adress对于我的电脑不好用更换源换conda源-已改使用python指定GPU,如下有一台服务器,服务器上有多块儿GPU可以供使用,但此时只希望使用第2块和第4块GPU,但是我们希望代码能看到的仍然是有两块GPU,分别编号为0,1,这个时候我们可以使用环境变量CUDA_VISIBLE_DEVICES来解决这个问题。比如:CUDA_VISIBLE_DEVICES=1 只有编号为1的GPU对程序是可见的,在代码中gpu[0]指的就是这块儿GPUCUDA_VISIBLE_

2020-11-05 21:33:43 6130

原创 2020-10-29

多块GPU的使用 - pytorch opt.device = t.device('cuda') if opt.use_gpu else t.device('cpu') net = t.nn.DataParallel(model, device_ids=[0, 1]) net.to(opt.device)训练starGAN

2020-10-29 22:00:19 187

原创 【论文阅读】Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation

摘要:当前流行的解决方案利用分类器中的对象定位映射作为监视信号,并努力使定位映射捕获更完整的对象内容。与以往主要关注图像内信息的努力不同,我们强调了跨图像语义关系对全面对象模式挖掘的价值adress:two neural coattentions are incorporated into the classifier to complimentarily capture cross-image semantic similarities and differences. 互补的获取图像语义的异同点特

2020-10-29 17:20:19 987

原创 2020-10-19

数据集路径 两个root 改变

2020-10-19 16:32:59 105

原创 linux安装matlab记录

将安装包文件下载在**1*/*2 下创建一个文件放置crack cd ***到文件夹 创建文件夹mkdir Crack解压文件 cd 解压tar -xvf Matlab2018aLinux64Crack.tar.gz -C Crack建立要挂载的文件夹 sudo mkdir /mnt/iso挂载 sudo mount -t auto -o loop /home/*1**/**2*/R2018a_glnxa64_dvd1.iso /home/huibing/mnt/iso 1*和2*为文

2020-10-17 11:35:29 389 1

原创 投稿相关

投稿过程中的英文理解问题汇总

2020-10-16 14:49:40 120

原创 linux系统配置pytorch环境记录

使用IP地址实现远程链接服务器1 虚拟环境的配置 下载VMware 和ubuntu系统iso文件安装并加载iso文件路径终端 名字@ip2 Xshell6 下载后 直接可以连接 方便一些 添加连接 +ip配置深度学习环境安装ubuntu系统 16.01 安装nvidia显卡驱动,禁用nouveau安装 sudo apt-get install vim编辑 sudo vim /etc/modprobe.d/blacklist.conf在文件中插入blacklist nouv

2020-10-12 14:37:44 1045

原创 学习资料re-id

汇总

2020-10-08 11:18:05 625

原创 【论文阅读】Exploring Spatial Significance via Hybrid Pyramidal Graph Network for Vehicle Re-identificatio

2020-10-07 21:58:35 1170 2

原创 【论文阅读】SPANET: SPATIAL PYRAMID ATTENTION NETWORK FOR ENHANCED IMAGE RECOGNITION

code其他的讲解we introduce Spatial Pyramid Attention Network (SPANet) to investigate the role of attention block for image recognition.

2020-09-29 21:56:53 1112

原创 【论文阅读】Further Non-local and Channel Attention Networks for Vehicle Re-identification

问题: 类间差异小,类内差异大提出:双分支自适应注意网络在视觉皮层双流理论的启发下, 基于non-local和channel关系 ,构建了一个双分支FNC网络来捕获多种有用信息(消除背景的影响)Further Non-local and Channel attention (FNC) is constructed to simulate two-stream theory of visual cortex提出了一种有效的 注意力融合方法 ,充分模拟了空间注意力和信道注意力的影响。Proposed

2020-09-28 22:07:16 486

原创 【论文阅读】Hierarchical Bi-Directional Feature Perception Network for Person Re-Identification

问题:最有判别力的特征 由于遮挡或者视角变化 造成缺失的时候就是最有用的缺失一部分解决:多层次信息相互关联,相互加强首先,利用低秩双线性池对跨层特征的相关映射进行建模。然后,在相关图的基础上,利用双向特征感知(BFP)模块丰富高级特征的注意区域,学习低级特征中的抽象和具体信息然后,我们提出了一种新的端到端层次网络,该网络集成了多级增强的特征,并将增强的中低层特征输入到后续的层中,以重新训练一个新的强大的网络。此外,我们提出了一种新的可训练的广义pooling,它可以动态地选择featur

2020-09-27 20:00:41 548

原创 【论文阅读】Pyramid Attention Networks for Image Restoration

论文地址论文代码参考博客参考知乎-具体细节注意力机制(Attention)Non-local Neural Networks图像非局部均值滤波的原理Non-local模块与Self-attention的之间的关系与区别? self-attention code introduction共同的部分都是利用相关特征学习权重分布,再用学出来的权重施加在特征之上进一步提取相关知识。 不过施加权重的方式略有差别,可以总结如下:加权可以作用在原图上;加权可以作用在空间尺度上,给不同空间区域加权;加权

2020-09-21 11:38:55 1558 2

原创 【python基础学习】

关于类的介绍 类就是一个模板,模板里可以包含多个函数,函数里实现一些功能 对象则是根据模板创建的实例,通过实例对象可以执行类中的函数 

2020-09-07 22:01:37 141

原创 code学习 - batch-dropblock-network+attention

conda activate pytorch1.3进入数据集所在位置python 数据集所在位置遇到问题: 程序运行没有报错,但是也无法获得结果。程序调试方法1.‘print’ 语句这是一个基本的调试问题的方法。 我们在程序中怀疑的地方插入print语句来了解程序的运行流程控制流和变量值的改变。 这是一个最简单的技术, 它的缺点。 需要进行程序编辑,添加’print’语句,必须重新编译,重新运行来获得输出。若需要调试的程序比较大,这将是一个耗时费力的方法。1*1卷积(基于升维降维的设计)

2020-09-04 09:40:42 364

原创 【论文阅读】Batch DropBlock Network for Person Re-identification and Beyond

论文地址论文代码论文翻译以及介绍别的博客关注人体的局部信息框架:全局和局部的特征结合在一起全局特征:提供了全局特征表示,对特征擦除分支进行监督局部特征:特征擦除,GMP获得2048维向量-1024维 (drop 的区域也可以渐进式的丢弃)批处理DropBlock层将随机丢弃张量T的相同区域 ######feature dropping branch 用 BatchDropBlock Layer 在 feature map T 执行,得到 batch erased feature map

2020-09-02 19:28:00 241

原创 【论文阅读】Cross-Resolution Adversarial Dual Network for Person Re-Identification and Beyond

考虑到真实场景中摄像机和目标人之间距离不同可能会带来 分辨率不匹配 的情况,会降低行人重识别算法的表现。这篇论文提出了一种的新的生成对抗网络来解决跨分辨率的行人重识别,可以学习分辨率不变的图像表示,同时能恢复低分辨率输入图像丢失的细节,共同用于改善重识别的性能。在五个标准行人重识别基准上的实验结果证实了该方法的有效性,尤其是在训练过程中不知道输入分辨率的情况下。此外,两个车辆重识别基准测试的实验结果也证实了该模型在交叉分辨率视觉任务上的通用性。从低分辨率到高分辨率,一般情况下的想法本文的创新:摘

2020-08-30 21:59:31 605

原创 【论文阅读】Improving Face Recognition from Hard Samples via Distribution Distillation Loss

论文地址代码地址其他的博客:主要是翻译知乎的介绍Abstract目前基于深度学习的人脸识别算法已经可以较好的处理简单样本,但对于困难样本(低分辨率、大姿态等)仍表现不佳。目前主要有两种方式尝试解决这一问题。第一种方法是充分利用某种需要处理的人脸畸变的先验信息,设计特定的结构或损失函数。这种方式通常不能方便地迁移到其他畸变类型。第二种方法是通过设计合适的损失函数,减小类内距离,增大类间距离,得到更具辨别能力的人脸特征。这种方式一般在简单和困难样本上存在明显的性能差异。为了提升人脸识别模型在困难样本上

2020-08-22 21:45:18 1268

原创 【CVPR2020论文合集】

论文合集再识别

2020-08-17 15:21:46 505

原创 【论文阅读】Salience-Guided Cascaded Suppression Network for Person Re-identification

论文地址显著导向的级联抑制网络用于行人再识别摘要动机:大部分都关注显著的特征,但是不显著的特征也可能同样的重要提出了: Salience-guided Cascaded Suppression Network (SCSN) which enables the model to mine diverse salient features and integrate these features into the final representation by a cascaded manner挖掘不

2020-08-11 21:57:46 1319 1

原创 【论文阅读】Tensor Low-Rank Reconstruction for Semantic Segmentation

论文地址论文代码代码暂时未开源**卷积网络中的non-local,**即:某一像素点处的响应是其他所有点处的特征权重和,将每一个点与其他所有点相关联,实现non-local 思想。摘要上下文信息在语义分割的成功中起着不可或缺的作用。事实证明,基于non-local的self-attention的方法对于上下文信息收集是有效的。由于所需的上下文包含空间和通道方面的注意力信息,因此3D表示法是一种合适的表达方式。但是,这些non-local方法是基于2D相似度矩阵来描述3D上下文信息的,其中空间压缩

2020-08-08 11:17:05 2611 12

原创 【论文阅读】Identity Preserving Generative Adversarial Network for Cross-Domain Person Re-identification

Identity Preserving Generative Adversarial Network for Cross-Domain PersonRe-identification这篇文章2019年被发表在IEEEacess期刊无监督跨域摘要行人再识别任务要求;问题:由于源域和目标域之间的偏差,大多数现有的人员再识别(re-ID)模型常常不能很好地从源域泛化。在源域中,模型被训练...

2020-08-04 21:41:49 946

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除