- 博客(46)
- 收藏
- 关注
原创 Pytorch nn.Module register_buffer
方法可以用来将张量注册为模型的缓冲区(buffer),它们不会作为模型的可训练参数参与反向传播,但会跟随模型一起移动到相应的设备,如 CPU 或 GPU。这通常用于存储模型中的状态信息,如均值、方差、或某些需要保留但不更新的中间结果。以下是一个简单的例子,说明如何使用。
2024-10-14 23:16:41
354
原创 Python模拟FIFO(先进先出)、最佳置换和LRU(最近最少使用)算法
【代码】Python模拟FIFO(先进先出)、最佳置换和LRU(最近最少使用)算法。
2024-06-12 00:34:15
331
原创 .requires_grad,.detach(),torch.no_grad()
【代码】.requires_grad,.detach(),torch.no_grad()
2024-05-01 22:04:46
48
原创 LLama2原始权重转Hugging Face权重
执行上述命令后,转换的模型权重将存储在指定的输出目录中。首先确保你的系统中已经安装了Hugging Face的。的路径,而不是刚刚下载到项目文件夹中的模型文件夹路径。它将要求输入你申请到的下载链接和要下载的模型。该脚本的完整路径稍后将用于执行模型转换。进入克隆下来的LLama项目目录,执行。脚本来下载模型权重。参数,根据您的实践下载模型替换即可。下载完成后,将下载下来的模型文件夹。转换LLama模型需要使用。为你在之前通过命令找到的。
2024-04-23 23:43:50
1519
原创 AttributeError: module ‘numpy‘ has no attribute ‘float‘.
当您在使用 NumPy 库进行编程时,可能会遇到一个错误提示:“AttributeError: module ‘numpy’ has no attribute ‘float’”。这意味着您正在访问 NumPy 模块中不存在的属性。安装 NumPy 1.23.5 或更低版本。,并且 NumPy 的版本是1.24或以上,那么您将会遇到上述错误。首先,卸载当前的 NumPy 版本。这个问题的出现是因为从 NumPy 1.24 版本开始,如果您的代码中使用了。另一个解决方案是直接在您的代码中替换所有的。
2024-04-12 22:59:54
4234
原创 单机多卡空闲GPU自动检测Pytorch多卡训练脚本
本文分享了一个Bash脚本,它能够自动检测空闲的GPU,并根据用户的需求分配相应数量的GPU以运行特定的命令或脚本。
2024-04-11 22:59:55
700
原创 RWKV并行形式与递推形式转化推导
对于这一公式,我们先关注其分子中的求和部分。为了严格描述,首先我们定义。而对于分母的求和部分,很明显其不过是没有了。公式中分子分母中的求和部分,便得到。增加1,其求和便会多出一项,且。现在可以看到其中完整地出现了。于是分子中的求和部分即为。项的和这一部分,我们将。之间的关系,我们先将。类似的推导,即可获得。
2024-03-13 18:11:10
896
原创 交叉熵损失与拓展
PyTorch 中的函数计算的是带有逻辑斯特回归(logistic regression)的二元交叉熵损失。这个函数适用于当模型的输出是未经过 sigmoid 激活的原始 logits 时。它在内部应用 sigmoid 函数,然后计算二元交叉熵损失。
2024-02-26 18:46:14
1059
原创 nn.BatchNorm1d 与 nn.BatchNorm2d 使用方法与原理
在PyTorch库中,是一个专为一维数据设计的批量归一化层。下面通过一些实例代码和其输出结果,让我们理解的工作机制。
2024-02-11 15:36:38
3521
原创 Conditional-DETR Match Loss PostProcess代码解析
其中criterion为models/conditional_detr.py中的SetCriterion类。outputs与targets进入其forward函数。outputs与targets形式分别如下:这里的bs为4,decoder层数(n_decoder)为4,object query数量为200。outputs包含最后一层的输出pred_logits(分类置信度,未经过sigmoid),pred_boxes(框,形式为cxcywh)与前几层的输出aux_outputs。
2024-02-08 00:44:18
1131
原创 tensor.topk() 使用方法
是 PyTorch 中的一个函数,用于获取张量(Tensor)中的最大的k个元素及其对应的索引。这在处理分类问题和排序问题时很常用。下面是。
2024-02-07 23:21:11
698
1
原创 ImportError: cannot import name ‘get_root_logger‘ from ‘mmdet.utils‘ 解决方法
为了确认这一点,我查找了本机的mmdet版本为 3.1.0。然后我查阅了 MMDetection 在 GitHub 上的历史版本代码。对比发现,2.28.0 版本的。MMDetection 版本过高(3.X)造成。降级到 2.X版本(如2.28.0)即可解决。在跑Deformable DETR时,我遇到了无法从。猜测是因为在最新版本的mmdet中,函数,而 3.X 版本中则不包含。
2024-02-03 15:16:25
2792
5
原创 符号扩展(Sign Extension)
符号扩展(Sign Extension)是计算机组成原理中的一个概念,它的作用是将一个较小的数据字长扩展到一个较大的数据字长,同时保持原有的数值和符号。当对一个有符号的整数进行符号扩展时,扩展的位(即新增的位)将复制原始数值的最高位(符号位)。,以确保扩展后的数值保持不变。因此,扩展后的数值将是。(以补码形式),它代表了一个。
2024-01-07 21:35:54
2906
原创 DETR类模型COCO训练结果异常,评测AP=0解决方案记录
接着我想到了我在coco_minitrain上只实验过1enc+4dec与3enc+6dec的缩水版模型(为了快速验证,hidden_dim与num_query均也有相应调小),于是猜测是不是完整的6enc+6dec难收敛的问题,于是我将1enc+4dec与3enc+6dec在完整COCO上实验,发现能得到正常的结果。因为之前的1enc+4dec与3enc+6dec的缩水版模型的参数量相对较小,我将其bs分别调整为8与4,对于3080TI 12G,这刚好能卡到显存上限。由此看来,bs似乎就是那个罪魁祸首。
2023-12-13 17:58:38
2315
9
原创 解决一个网络问题
这个命令会重置Winsock相关的网络设置,因此请注意在运行该命令之前,最好备份你的网络设置或者确保你知道如何重新配置它们。首先,我们需要以管理员权限启动命令提示符(CMD)。这是因为进行网络设置相关的操作需要管理员权限,否则可能无法生效。完成上述命令后,我们需要重新启动电脑,以确保网络设置得到正确应用。
2023-08-05 12:10:37
74
原创 Python中的*args和**kwargs
这两种参数能够接收函数中传入的任意数量的位置参数和关键字参数,使得我们能够创建出更加灵活和可适应性更强的函数。接收了两个关键字参数(name=“John”, age=28)。是常用的命名约定,但你可以使用任何你喜欢的名称,只要在名称前加上。下面是一个简单的示例,说明如何使用。接收了三个位置参数(1,2,3),,并将它们存储在一个元组中。,并将它们存储在一个字典中。在Python编程语言中,
2023-07-19 18:22:59
74
原创 评教车轱辘话20条
17. 这位老师注重课堂氛围的营造,让学生在轻松的环境中学习。18. 老师关注学生的综合发展,注重培养他们的品德和社交能力。2. 老师讲解清晰,注重培养学生的批判性思维和问题解决能力。6. 老师关注每个学生的个人发展,给予个性化的指导和支持。8. 老师用生动的教学方式激发学生对知识的热爱和求知欲望。13. 这位老师对学生关心备至,积极解决学生的问题和困惑。19. 这位老师用生动的案例和实例帮助学生理解抽象的概念。16. 老师对每个学生的学习进步都给予及时的认可和鼓励。
2023-06-07 21:17:03
185
原创 CUHK-SYSU行人搜索数据集介绍及结构
街拍和电影收集的图像。:18184个结构体,描述每个图像的行人信息,包括图像名称(imname)、出现的行人数量和位置(nAppear和box)。:11934个结构体,每个结构体代表一个人物,每个人物至少在两张图像中出现。包含人物ID(idname)、出现时间(nAppear)以及每个场景中的位置(Person(i).scene.idlocate)。:测试集包含的6978个图像。:用于训练的5532个查询人物。
2023-05-23 11:26:39
1910
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人