- 博客(19)
- 收藏
- 关注
原创 2025CVPR论文-mamba(视觉领域)
目录Samba: A Unified Mamba-based Framework for General Salient Object DetectionSelf-supervised ControlNet with Spatio-Temporal Mamba for Real-world Video Super-resolutionExploiting Temporal State Space Sharing for Video Semantic SegmentationEvent-based Video
2025-04-18 15:57:52
473
原创 DIVE INTO DEEP LEARNING 学习笔记(准备工作)
这些命令用于下载并解压《动手学深度学习》(Dive into Deep Learning, D2L)的英文版教材代码和资源(PyTorch版本):创建一个名为d2l-en的目录。&&:如果前一个命令成功执行,则继续执行下一个命令。cd d2l-en:进入刚创建的d2l-en目录。&&是 PowerShell 5.1+才能使用的命令(要么升级PowerShell 的版本,要么分开写)使用curl工具从下载文件。:将下载的文件保存为本地名为d2l-en.zip。:解压d2l-en.zip文件到当前目录。
2025-04-18 15:57:27
284
原创 MambaVision: A Hybrid Mamba-Transformer Vision Backbone
对于计算机视觉任务来说,它不像序列任务那样(关注序列顺序),它考虑它周围的信息(上下左右)。计算机视觉任务需要关注全局的信息,但mamba只能看到每一时刻前的序列信息。
2025-04-17 09:05:53
789
原创 Video Mamba: State Space Model for Efficient Video Understanding
所以如果改进的 话可不可以在这篇论文的基础上加上depthwise convolution来下采样减少计算量呢?解决长程依赖(mamba本事具有的优势)(CNNs有问题二,ViT有问题一)(多加了个时序ps和位置特征pt)(多加了位置特征Epos)对变化敏感,即使变化很小。
2025-04-16 20:58:42
899
原创 Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model阅读笔记
在MambaIRv2: Attentive State Space Restoration这篇文章中分别使用了positional embeding and "注意力机制"的引入C=(C+P),从而实现关注到全局。这完全跟vision transformer(ViT)干的事情一样啊。感觉创新点的话就一个双向吧。
2025-04-16 18:28:45
142
原创 初识Mamba
本文的主要内容:1,对一篇关于Mamba模型解读的阅读笔记1,对一篇关于Mamba科普文的阅读笔记 (涉及较多前置知识特别是ssm/S4的介绍)2,对提出Mamba原始论文的阅读笔记4,对mamba论文的一作Albert Gu在YouTube上关于S4论文的解读5,6,github上mamba代码:Mamba,其基于SSM或S4发展为S6(RNN的缺陷:1,由于梯度消失和梯度爆炸的原因,ht一般只包含前面若干步而非之前所有步的隐藏状态。(短期记忆)
2025-04-15 08:53:02
759
原创 pycharm专业版连接远程服务器
而且还要在这里激活虚拟环境,那为什么起初选python解释器的时候还要选对应虚拟环境中的python解释器呢?但是由于连接的是登录节点,不是计算节点,所以这里运行其实是在登录节点上运行的。就可以看到远程主机的文件内容了(在这里你还可以进行文件的删除添加等操作)然后下面那个同步文件夹,就是为了方便本地和服务器的文件同步的。文件->设置->python解释器->添加解释器->基于SSH。(1)这里的从此处下载指的是把文件从远程服务器下载到本地。点击创建->应用->确定 ,这样就连接上远程服务器了。
2025-04-14 23:30:20
287
原创 MambaIRv2: Attentive State Space Restoration论文解读
本文提出了一种名为MambaIRv2的图像恢复模型,该模型通过引入类似于视觉变换器(vision transformers (ViTs))的非因果建模能力,即引入注意力机制,允许模型在单次扫描中关注整个图像,解决了Mamba模型在图像恢复任务中因因果建模限制而无法充分利用图像像素的问题。
2025-04-12 20:48:33
739
原创 如何在远程服务器上运行本地项目
本文主要讲的是如何在超算中心上创建虚拟环境并配置环境(安装相应的包,配置.yml环境),以及如何在超算中心上运行修改项目。下一篇主要讲使用pycharm专业版连接远程服务器,使得项目能在pycharm上进行项目的修改,debug等。
2025-04-05 21:12:05
1084
原创 虚拟环境的创建和删除(基于conda)
安装完anaconda后:(anaconda中集成了许多package及其依赖项anaconda拥有conda包,环境管理器,以及众多开源库PyTorch官网也推荐采用Anaconda进行包管理,因为Anaconda会安装所有的。
2025-04-02 17:29:33
396
原创 pytorch神经网络的构建(代码部分)
以上是原文,以下是笔者笔记由于笔者对这一部分原理比较了解,所以本文只对代码进行整理记录,可根据需要查看。本文的主要内容:神经网络的骨架Module,各种layer(卷积层,池化层,线性层)的构造,激活函数的使用,loss(损失),backward(反向传播),optimizer(优化器)以及对现有模型的使用和修改,网络模型的保存与读取。
2025-03-30 11:12:17
790
原创 完整的pytorch模型代码
本文内容涉及完整的模型训练流程,包括:数据集的加载,模型的创建与训练,tensorboard面板可视化损失变化/精确度变化,是否使用cpu训练,记录开始结束时间等(包含注释,如果有不理解的可以看前几篇文章,注释更丰富)则outputs.argmax(0)=[1,2] outputs.argmax(1)=[1,0,1]若outpus=[[0.1,0.3],可以看出一个是纵向的,一个是横向的。以上是原文,以下是笔记。
2025-03-30 10:32:37
297
原创 transforms的使用-pytorch深度学习快速入门篇
zhzasbhw以上是原文,以下是笔记transforms包的主要功能是实现对数据的一些变换。本文主要讲一下transforms中的几个类的功能以及使用方法,包括ToTensor,normalize,Resize,compose,RandCrop。
2025-03-28 15:12:54
680
原创 tensorboard的使用
如何查看SummaryWriter的功能呢?可以像使用help(SummaryWriter),也可以按着ctrl键然后点击SummaryWriter,如下图。不难得出结论,如果‘title’不变则会在同一区域展现,要想在不同区域展现则要么删除之前生成的logs文件,要么换个‘title’再输入如下图所示内容(logdir=后面是logs文件夹的地址,最好是绝对路径哦)但是如果再改成(没改‘标题名’,只改了对应关系)然后再安装tensorboard。删除logs文件夹下的所有文件。
2025-03-27 22:47:49
390
原创 dir(),help()用法-pytorch深度学习快速入门篇
注意虽然AVG是个函数,但要写成help(torch.AVG)而不是help(torch.AVG())torch相当于工具箱,工具箱里有更小的工具箱,更小的工具箱里可能有更更小的工具箱,最后是工具。我们使用dir()打开工具箱->dir(torch)可以看到这里的输出前后有'__',说明AVG是个函数。那么可以使用help()来查看这个函数的功能。首先认识两个函数dir(),help()以下是看这个视频的学习笔记内容。
2025-03-27 17:58:04
102
原创 pytorch安装
所以下载anaconda来实现虚拟环境的创建(可以理解为一山不容二虎,利用anaconda把老虎隔离起来,一个虚拟环境的创建相当于一座房子,老虎在房子里,让不同老虎之间看不到)一个是刚刚安装好的Anaconda自带一个基础环境base,另一个是刚刚创建的虚拟环境pytorch(这个环境的名称叫pytorch,其实起什么名字都可以,例如下图)看下面这个安装就行,我就是看这个下的,期间也遇到了些问题,如果你也有问题,可以看看下面的,或许有帮助。看到最上面的字了吧,python版本至少是3.9的。
2025-03-27 14:14:51
366
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人