- 博客(52)
- 收藏
- 关注
原创 虚拟环境配置实战-经验总结
也会下载gpu版本的torch,因为参数 pytorch-cuda,这是一个元数据包,专门用来告诉 conda 安装支持CUDA的PyTorch版本,但是pytorch-cuda 依赖于 cuda-cudart 等精确版本的 CUDA 组件,这些组件是 NVIDIA 官方维护的,所以要有-c nvidia/conda-forge 这两个官方频道否则可能会报错。按照PyTorch Geometric官方建议,在安装好PyTorch后,使用 pip 并指向其官方的wheel仓库来安装是最可靠的方法。
2025-12-17 23:12:20
279
原创 gpu硬件,gpu驱动,cuda,CUDA Toolkit,cudatoolkit,cudnn,nvcc以及如何安装cudatoolkit/CUDA Toolkit
其中nvcc是CUDA的编译器,它可以将CUDA代码(即包含GPU加速部分的代码)编译成能够在NVIDIA GPU上执行的二进制代码。cuDNN:是NVIDIA为深度学习和神经网络训练优化的库,基于CUDA开发,提供了一些高度优化的运算库,特别适用于深度学习中的卷积操作。nvcc:是CUDA的编译器,用于将CUDA代码编译成可在GPU上执行的代码。CUDA Toolkit:是开发者在CUDA平台上编程时使用的工具集,包括编译器、库、工具等。可以查看已有系统cuda版本,而不是驱动支持的cuda版本上限)
2025-05-09 20:39:39
799
原创 .whl文件
不同,Wheel 文件不需要在安装时进行编译,因此安装速度更快,过程更简便。Wheel 文件可以针对不同的操作系统、Python 版本和 CPU 架构进行构建,确保在各种环境下的兼容性。适合在网络受限或无法访问 PyPI 的环境中进行离线安装。文件本质上是一个 ZIP 压缩包,内部包含了 Python 包的所有必要文件和元数据。它是一种预编译的二进制分发包,旨在加快和简化 Python 包的安装过程。文件是 Python 的一种打包格式,全称为。文件,只需将命令中的。在安装时,确保所使用的。
2025-04-22 20:06:10
992
原创 conda&pip&pip3&virtualenv
commands-conda documentationIf you have used pip and virtualenv in the past, you can use conda to perform all of the same operations. Pip is a package manager and virtualenv is an environment manager. conda is both.Scroll to the right to see the entire tab
2025-04-22 09:11:58
723
原创 pycharm专业版连接远程服务器
而且还要在这里激活虚拟环境,那为什么起初选python解释器的时候还要选对应虚拟环境中的python解释器呢?但是由于连接的是登录节点,不是计算节点,所以这里运行其实是在登录节点上运行的。就可以看到远程主机的文件内容了(在这里你还可以进行文件的删除添加等操作)然后下面那个同步文件夹,就是为了方便本地和服务器的文件同步的。文件->设置->python解释器->添加解释器->基于SSH。(1)这里的从此处下载指的是把文件从远程服务器下载到本地。点击创建->应用->确定 ,这样就连接上远程服务器了。
2025-04-14 23:30:20
501
原创 pytorch安装以及一些包的介绍
所以下载anaconda来实现虚拟环境的创建(可以理解为一山不容二虎,利用anaconda把老虎隔离起来,一个虚拟环境的创建相当于一座房子,老虎在房子里,让不同老虎之间看不到)一个是刚刚安装好的Anaconda自带一个基础环境base,另一个是刚刚创建的虚拟环境pytorch(这个环境的名称叫pytorch,其实起什么名字都可以,例如下图)看下面这个安装就行,我就是看这个下的,期间也遇到了些问题,如果你也有问题,可以看看下面的,或许有帮助。看到最上面的字了吧,python版本至少是3.9的。
2025-03-27 14:14:51
434
原创 zerotier-cli listpeers/ listnetworks命令以及IP的理解
若设备的ip地址为192.168.195.210,那么192.168是私有IP的地址范围的标识(类比小区编号),在公网互联网上不可路由,只在内部网络使用。195是子网编码(类比于某栋楼的编号),210是设备的主机号(类似于门牌号)。私有IP地址:在本地网络内标识设备,在局域网内唯一,不可直接从互联网访问,范围固定(10.x.x.x, 172.16.x.x, 192.168.x.x)公有IP地址:由ISP(如电信、联通)分配,全球唯一,可被任何地方访问,例如120.244.128.12。
2025-12-11 18:08:33
507
原创 检索增强VS知识蒸馏VS伪标签扩展
但教师模型输出的概率分布往往比较“硬”,例如[0.01,0.12,0,0,0,0.87]这种,为了让隐藏在极小概率值中的“暗知识”更容易被学生学习,需要将其软化,例如[0.1,0.3,0.07,0,0.03,0.5]这种。学生模型的损失函数由两部分组成,第一部分保证模型具备独立解决问题的能力(当T=1时,模型的预测结果与真实标签的交叉熵损失),第二部分是为了保证模型能学习到教师模型的暗知识(当T1=T2>1时,教师模型与学生模型预测结果概率分布的KL散度,衡量两个分布之间的差异)
2025-12-05 17:49:47
258
原创 A-Teacher: Asymmetric Network for 3D Semi-Supervised Object Detection
聚合过去将来的信息来改善老师模型的检测效果(从而产生更好的伪标签来使得学生模型更好的更新参数)总结过去和将来时间戳的信息从而改进在当前帧的伪标签的质量。(这个伪标签用来训练学生模型)兼具上述两个模型的优点。即可以联合更新教师和学生模型,又能保证模型的复杂性。前者是效率,强调高效。后者是效力,强调有效。老师模型是一个单帧的检测器。
2025-05-24 16:44:19
2177
原创 MambaIRv2: Attentive State Space Restoration代码解读(train部分)
(应该是随机种子固定了,所以每一GPU每一epoch得到的数据分片都是固定的,从而需要知道当前的epoch,避免看到重复的数据切片)本文主要用于自用,(这篇主要是train部分的),记录了一些我看代码的过程以及理解。,它的作用是创建一个自定义的分布式采样器,确保多GPU训练时数据的高效分配和潜在的数据集增强。实现端到端的训练流程,包括配置解析、环境初始化、数据加载、模型训练、验证和日志记录。从而实现区分训练/验证/测试的数据,便于后续环节的进行。这段代码实现的功能是保存最新的状态文件路径。
2025-05-21 15:40:59
1264
原创 MambaIRv2: Attentive State Space Restoration代码解读(network部分)
本文主要用以自用(这篇主要是部分,等会会有两篇关于和部分的),记录了一些我看代码的过程以及理解。如果能帮到您一些最好。本文一开始是介绍一些模块的功能以及具体实现在代码中的哪些部分(所以前可能解释比较少,因为我在看代码的大块,就是了解弄清楚结构,后面的解释会详细一点。但本文的解释并不全,因为我只看了我想要了解的部分)使用方法:定位到你想了解的部分。我写的并不全,所以如果找不到就不要一直找了。注意:只能在linux系统上跑这个(用到了mamba,mamba只能在linux系统上,具体来说是因为causal_
2025-05-21 15:32:38
2405
原创 torch.matmul() VS torch.einsum()
张量收缩(Tensor Contraction)(高阶张量乘法):爱因斯坦求和约定(更通用的张量运算工具)批量矩阵乘法(更高维张量)
2025-05-21 14:10:20
882
原创 End-to-End Autonomous Driving without Costly Modularization and 3D Manual Annotation
当前的E2EAD模型仍然模仿典型驾驶堆栈中的模块化架构,即精心设计了监督感知和预测子任务,为定向规划提供环境信息。场景下规划的鲁棒性。这个策略能够从不同的增强视角来学习预测轨迹的一致性。)来减弱对3D标注数据的需要。该前置模型通过预测角度方向的。引入的角度查询将两个模块链接为一个整体任务来感知驾驶场景。空间中每个扇区区域的物体/客观性/对象性(?最优角度解码器可以看作是一个增强世界模型,能够。角度解码器,通过预测无法访问的未来状态来吸收。提出了一个自监督的学习策略来增强在。角度感知模块,通过预测。
2025-05-18 17:57:16
472
原创 Ocean: Object-aware Anchor-free Tracking
分类置信度是通过从固定的局部区域得到的特征估计出来的,所以当物体尺度变化的时候它并不会改变。的回归网络仅在正样本(当框和目标物体的重合超过一个标准时,称这个框为正样本)上训练(训练集中只有分类正确的时候,也就是当前面分类错误的时候,后面的回归网络也没有修正这个不准确的预测的能力。的,即使重叠的部分很小,那也还是有位于目标物体内的像素点在框内的,训练的时候见过,所以有纠正预测的可能),使得更好的实现背景和目标物体之间的区分,也获得了一个全局的外观描述。和目标物体的重叠很少时(因为这个时候的框为负样本,
2025-05-17 20:48:53
1147
原创 Deeper and Wider Siamese Networks for Real-Time Visual Tracking
效果就不太好了(因为网络比较浅,不能充分提取图像的特征。)但是使用一些比较深/宽的网络替换掉之前的。卷积过程中使用的填充会导致位置的偏移,从而导致位于search range边缘的物体检测不准确。后发现其效果反而更差了,所以本文就探索了是什么原因导致的这个现象,并提出了几种不同的。如果要处理一些比较复杂的视觉问题时,使用孪生网络之前的。感受野的增大导致特征差异以及局部精细度感知的降低。步长会影响局部精度,特别是对于小的物体。
2025-05-16 20:01:47
836
原创 opt, args=parse_options(root_path, is_train=True)
为什么需要保持顺序:打印或日志输出时,有序字典更易于定位参数。自定义的加载器,用于保持 YAML 中字段的原始顺序(普通。从而实现区分训练/验证/测试的数据,便于后续环节的进行。组合其他参数:(调试模式+修改批量大小+提高日志频率)包含了所有通过命令行传入的参数及其对应的值。:指定YAML配置文件的路径,是连接。:包含模型、数据集、训练超参数等所有。优先级:命令行参数>YAML配置。# 添加–debug参数即可。如何查看所有可用参数?这里的phase是什么?的一个特殊字段,通过。未指定的参数使用默认值。
2025-05-10 11:54:26
627
原创 ModuleNotFoundError: No module named ‘torch._C‘
【代码】ModuleNotFoundError: No module named ‘torch._C‘
2025-05-09 18:29:30
467
原创 AssertionError: An object named ‘MambaIRv2‘ was already registered in ‘arch‘ registry!
但只是提醒,不影响项目运行,能跑通,所以不改了,就这样先。也没解决,出现了其它错误。修改registry.py。把绝对路径改为相对路径。
2025-05-09 15:09:17
823
原创 ‘ReadTimeoutError(“HTTPSConnectionPool(host=‘pypi.org‘, port=443): Read timed out. (read timeout=15)
【代码】‘ReadTimeoutError(“HTTPSConnectionPool(host=‘pypi.org‘, port=443): Read timed out. (read timeout=15)
2025-05-08 09:03:35
277
原创 怎么有效管理项目路径(避免使用绝对路径)
方法会自动处理不同操作系统的路径分隔符(如。怎么有效管理项目路径(避免使用绝对路径)假设train.py文件的绝对路径为。,显式地告诉 Python:“把。有区别,下面这两个没区别。但如果直接运行可能会报错。也加入模块搜索路径”。
2025-05-07 16:49:39
436
原创 Could not load library libcudnn_cnn_infer.so .8. Error: libnvrtc.so: cannot open shared object file:
参考: https://blog.51cto.com/u_15962038/12144356。(系统本身就有,然后pip的时候又安装了)卸载掉有cu118的。
2025-05-07 15:03:12
477
原创 运行MambaIRv2: Attentive State Space Restoration代码时遇到的问题
说No such file or directory: '/data2/guohang/dataset/ARTSR/Set5/LR_bicubic/X2' 我一看后面的地是测试数据集的地址,前面的地址不知道啥。我打开了这个配置文件,并把它里面的地址改成了我电脑上数据集相应的地址。模型的当前结构与预训练权重文件中的结构不匹配,导致无法正确加载权重。中,可能指定了一个错误的或不可访问的数据集路径。找到对应的预训练模型,下载好后,再次运行。21G,我觉得可以先不用训了。那我应该是下载错预训练权重了,改一下。
2025-04-23 21:05:22
353
原创 配置MambaIRv2: Attentive State Space Restoration的环境
因为这里默认安装包从defaults通道,但这里的包实际上更新比较慢,所以我使用了如下命令让conda-forge通道为优先级最高的通道(conda-forge是社区驱动的,更新包较快)(conda-forge is a community effort that provides conda packages for a wide range of software.)我想输入以下命令来更改环境的python版本,但是报错啦,不知道什么原因。所以我把现有的mambair环境删了,再重新创一个。
2025-04-23 13:05:38
780
原创 Ubuntu与Linux的关系
是“汽车”(一个完整可用的系统),它用 Linux 做发动机,但还加上了图形界面、驱动程序、各种软件包,让用户可以直接使用。它是一个类 Unix 系统,免费、开源,许多不同的操作系统(叫“发行版”)都是基于 Linux 内核构建的。它是目前最流行、最易用的 Linux 发行版之一,尤其适合新手和开发者。是“发动机”(内核)。
2025-04-22 20:08:44
983
原创 几种文件格式(存储表格数据或结构化数据)
字段之间用制表符(\t)作为分隔符。例如,姓名\t年龄\t性别TSV文件在处理包含特殊字符的数据时具有优势,因此在一些数据处理场景中,如生物信息学、日志文件处理等领域,TSV文件可能会更受欢迎。
2025-04-22 17:28:37
462
原创 2025CVPR论文-mamba(视觉领域)
目录Samba: A Unified Mamba-based Framework for General Salient Object DetectionSelf-supervised ControlNet with Spatio-Temporal Mamba for Real-world Video Super-resolutionExploiting Temporal State Space Sharing for Video Semantic SegmentationEvent-based Video
2025-04-18 15:57:52
1626
原创 DIVE INTO DEEP LEARNING 学习笔记(准备工作)
这些命令用于下载并解压《动手学深度学习》(Dive into Deep Learning, D2L)的英文版教材代码和资源(PyTorch版本):创建一个名为d2l-en的目录。&&:如果前一个命令成功执行,则继续执行下一个命令。cd d2l-en:进入刚创建的d2l-en目录。&&是 PowerShell 5.1+才能使用的命令(要么升级PowerShell 的版本,要么分开写)使用curl工具从下载文件。:将下载的文件保存为本地名为d2l-en.zip。:解压d2l-en.zip文件到当前目录。
2025-04-18 15:57:27
420
原创 MambaVision: A Hybrid Mamba-Transformer Vision Backbone
对于计算机视觉任务来说,它不像序列任务那样(关注序列顺序),它考虑它周围的信息(上下左右)。计算机视觉任务需要关注全局的信息,但mamba只能看到每一时刻前的序列信息。
2025-04-17 09:05:53
897
原创 Video Mamba: State Space Model for Efficient Video Understanding
所以如果改进的 话可不可以在这篇论文的基础上加上depthwise convolution来下采样减少计算量呢?解决长程依赖(mamba本事具有的优势)(CNNs有问题二,ViT有问题一)(多加了个时序ps和位置特征pt)(多加了位置特征Epos)对变化敏感,即使变化很小。
2025-04-16 20:58:42
1020
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅