使用mmrotate时的bug：“batch_size=0”

原创

已于 2025-03-04 14:58:38 修改 · 378 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#bug #目标检测 #人工智能 #python #深度学习

于 2025-03-04 14:48:58 首次发布

在没有指定gpu的时候，会出现以下这个错误

if device.type == “cpu”:
^^^^^^^^^^^
AttributeError: ‘int’ object has no attribute ‘type’

但是指定了之后，又会出现以下这个batch_size=0

raise ValueError(f"batch_size should be a positive integer value, but got batch_size={batch_size}")
ValueError: batch_size should be a positive integer value, but got batch_size=0

解决方法参考：MMrotate 训练报错（‘int‘ object has no attribute ‘type‘）-优快云博客

解决方法：

在D:\Anaconda\envs\mmrotate3\Lib\site-packages

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

忽略不计，

关注关注

8
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用mmrotate时遇到的BUg：nms_rotated(): incompatible function arguments. The following argument types are s

m0_52805415的博客

03-04

948

找到“mmcv\ops\nms.py”文件中的”nms_rotated“函数。新版本的这个函数中少传了一个“input_labels”参数。测试demo的时候，出现了这个错误，替换为以下的代码即可（

mmrotate：详细解读eval_map.py里面的计算TP和FP的代码，并计算虚警率和漏警率

weixin_46812066的博客

03-30

1180

简单来说：如果一个det的IOU大于阈值，那么就先认为它是True，但有可能nms那一步的时候，用score筛选得不是很好，以至于好几个det同时框在了一个gt上，所以那些框的不是很好的det即使大于了iou阈值，也要被划成fp；另外，对于那些小于iou阈值的det，就全部划成了fp。对于那些置信度本来就小于score的det，就认为是negetive，也就是fp和tp全部赋为0。如果需要计算fn，那就用gt的数量减去tp就好~

参与评论您还未登录，请先登录后发表或查看评论

MMrotate 训练报错（‘int‘ object has no attribute ‘type‘）

weixin_45716425的博客

11-15

1495

注意：一开始定位在\site-packages\torch\nn\parallel_functions.py 这个文件中做修改没有用，之后改在\mmcv\parallel_functions.py中做对应修改后代码跑通。在D:\Anaconda\envs\mmrotate3\Lib\site-packages\mmcv\parallel_functions.py中做如下修改。

Python 中 AttributeError: Int object Has No Attribute 错误

热门推荐

迹忆客

12-01

2万+

int 数据类型是最基本和最原始的数据类型之一，它不仅在 Python 中，而且在其他几种编程语言中都用于存储和表示整数。只要没有小数点，int 数据类型就可以存储任何正整数或负整数。本篇文章重点介绍并提供了一种解决方案，以应对我们在 Python 中使用 int 数据类型时可能发生的特定错误。

AttributeError: ‘int‘ object has no attribute ‘type‘

m0_56841969的博客

11-22

920

报错原因：可能是原先代码用了多卡训练，返回的是列表如['0','1']，然后我这里只有单卡，返回的是整数0被识别了，就产生了错误，得在源头上让单卡是0的情况也被识别成功。对mm系列真的是又爱又恨，很方便做baseline又特别容易报错，有时候报的错还解决不了。解决方法：为了不动pytorch包下的文件，我这里改了mmdet的内容。

解决AttributeError: ‘int‘ object has no attribute ‘encode‘

牛肉胡辣汤

10-23

6322

"AttributeError: 'int' object has no attribute 'encode'"错误通常发生在对整数类型进行字符串编码或字符串处理操作时。通过检查变量类型、检查代码逻辑和使用异常处理，我们可以解决这个问题。在Python编程时，及时检查变量类型和代码逻辑，并使用适当的异常处理机制，是避免这类问题的关键。相信通过本文的介绍，您能够更好地理解并解决这个错误，并在以后的编程中避免类似的问题的发生。

【Python】解决Python报错：AttributeError: ‘int‘ object has no attribute ‘xxx‘

科技改变人类，技术成就未来

05-31

6502

解决Python报错：AttributeError: 'int' object has no attribute 'xxx'

10-18

if os.path.getsize(ann_file) == 0: continue with open(ann_file) as f: s = f.readlines() for si in s: bbox_info = si.split() if len(bbox_info) < 9: continue # skip invalid line poly = np....

下面这个函数可以在GPU上运行吗？能使用cuda加速吗？函数是代码中的一部分，只分析原因和结果，不用写代码。def ExtractPIIFDFeatureOfObbAnchors(self, obbrois, imgpath): """对一张图片提取PIIFD特征 Args: obbrois(list[Tensor(H*W,5)]):5个特征层的旋转锚框 imgpath(str):原图的路径 Returns: imgpiifdlist[list[Tensor(batch,5,H,W)]]:5个特征层的piifd张量 """ start_time = datetime.now() image = cv2.imread(imgpath) # 定义存储该图片5个特征层对应的piifd特征向量的存储列表 imgpiifdlist = [] # 读取视觉词典 mat_file = 'BOF/vocabulary_256.mat' data = scipy.io.loadmat(mat_file) vocab = data.get('vocabulary').astype('float32') # with open('BOF/vocabn500s4v128.pkl','rb') as f: # vocab = pickle.load(f) # 循环取出每一个特征层处理 for roisall in obbrois: # 定义该特征层锚框对应感兴趣区域的piifd特征向量存储列表 roispiifdlist = [] # 定义piifd特征的长度,包括piifd描述子（256）+全局特征（8） obb_feats_len = 256 + 8 print('....................Start calculate one feature map .....................') for i in range(roisall.shape[0]): RegOfROI = roisall[i].cpu() # print('Calculating NO ', str(i), 'roi') # 1. 根据roi坐标扩展旋转框，返回扩充后的新的roi expansion = 5 ExpandRegOfROI = self.expand_rotated_rect(RegOfROI, expansion) # 2. 对扩展前后的roi分别进行提取矩形框 rotated = self.GetRotatedImg(RegOfROI, image) rotated_pad = self.GetRotatedImg(ExpandRegOfROI, image) # rotated_pad = np.pad(rotated,((5, 5), (5, 5), (0, 0)), mode='edge') # 保存裁剪后的图像 # cv2.imwrite('rotated.jpg', rotated) # cv2.imwrite('rotated_pad.jpg',rotated_pad) # img = cv2.imread(r'D:\MMRotate_LiYangFan\ship_detection\tools\cropped_image.jpg') # 将原始图像转换为灰度 gray_image = cv2.cvtColor(rotated, cv2.COLOR_BGR2GRAY) gray_image_pad = cv2.cvtColor(rotated_pad, cv2.COLOR_BGR2GRAY) # 转为双精度浮点型 image1_gray_np = np.array(gray_image) image1_gray_pad_np = np.array(gray_image_pad) image1_double = image1_gray_pad_np.astype(np.float64) # 3. 对扩展前的roi进行Fast关键点提取 corners_FAST1 = self.FastPointsDetect(image1_gray_np) # 4. 将原roi坐标转换至新的roi区域内 adjusted_keypoints = [(x + expansion, y + expansion) for x, y in corners_FAST1] adjusted_keypoints = np.array(adjusted_keypoints) # 5. 将扩展后的roi和新的坐标往后传 obb_feats = None if adjusted_keypoints.size == 0: # 该锚框所在图像区域没有检出关键点 obb_feats = torch.zeros(1, obb_feats_len, dtype=torch.float32).cuda() # print('#####No Points#####') else: # 该锚框所在区域检出关键点，则进行复杂网络演化进一步得到筛选后的关键点，利用筛选后的关键点求对应的PIIFD描述子，将PIIFD描述子与 # 复杂网络得到的全局特征结合构成认知特征 # 定义复杂网络的常量 Versionf = 1 # 版本 Num_evolution = 2 # 演化次数 # start_complexNet_time = datetime.now() # 提取图像经过复杂网络演化的全局特征、局部特征、图中点的坐标 global_features_all, local_features_all, graph_pos = FeatureExt_CN(adjusted_keypoints,Num_evolution, Versionf,gray_image_pad) # end_complexNet_time = datetime.now() # print('#####Complete one roi complexNet : ',(end_complexNet_time - start_complexNet_time),'######') # 经过复杂网络演化之后，关键点没有了 if global_features_all == None and local_features_all == None: obb_feats = torch.zeros(1, obb_feats_len, dtype=torch.float32).cuda() else: # 定义MS-PIIFD算法常量 G_resize = 3 # 高斯金字塔的降采样单元 G_sigma = 1.6 # 高斯金字塔的模糊单元 numLayers = 4 # 高斯金字塔每组层数 4 numOctaves = 3 # 高斯金字塔的组数 3 # 选取复杂网络的第几层 Ti = 1 graph_pos_Ti = np.array(graph_pos[Ti]) graph_pos_Ti[:, 1] = image1_double.shape[0] - graph_pos_Ti[:, 1] # 多尺度PIIFD # sig = get_gaussian_scale(G_sigma, numLayers) # descriptors_MS = get_multiscale_piifdm(image1_double, graph_pos_Ti, numOctaves, numLayers, G_resize,sig) # 单尺度PIIFD start_piifd_time = datetime.now() descriptors = PIIFD_Descriptor(p=graph_pos_Ti, I=image1_double, octave=1, G_resize=G_resize) descriptors = descriptors[:, 6:] end_piifd_time = datetime.now() print('~~~~~~~~~~~~Complete one roi piifd:', (end_piifd_time - start_piifd_time),'~~~~~~~~~~~') # 度中心性 degreesCentrality:dict local_features_Ti = local_features_all[Ti] featureS_local_Ti_degreeCentrality = local_features_Ti['degreesCentrality'] featureS_local_Ti_degreeCentrality_values = [] for key, value in featureS_local_Ti_degreeCentrality.items(): if isinstance(value, float): featureS_local_Ti_degreeCentrality_values.append(value) featureS_local_Ti_degreeCentrality_values = np.array(featureS_local_Ti_degreeCentrality_values) local_vocab_values = self.GetNormHist(vocab, descriptors, featureS_local_Ti_degreeCentrality_values) # 5. 将字典中的值取出并合并 global_features = global_features_all[Ti] featureS_global_Ti_values = [] for key, value in global_features.items(): if isinstance(value, float): featureS_global_Ti_values.append(value) # 转换为 NumPy ndarray 并调整形状为 [1, N] global_feature_values = np.array(featureS_global_Ti_values).reshape(1, -1) obb_feats = np.concatenate((local_vocab_values, global_feature_values), axis=1) obb_feats = torch.from_numpy(obb_feats).cuda().type(torch.cuda.FloatTensor) # piifd_descriptor = piifdcreate(gray_image) # print(piifd_descriptor.shape) # piifdlen = piifd_descriptor.shape[1] roispiifdlist.append(obb_feats) # 获取每一个特征层的宽高 roishw = int(math.sqrt(roisall.shape[0])) # 将该特征层piifd特征向量的列表改成H×W×piifd特征向量的形状（此处需要确定源特征成的形状以及传入参数的类型是否正确） concatenated = torch.cat(roispiifdlist).view(roishw, roishw, obb_feats_len).permute(2, 0, 1).unsqueeze(0) # 获得一张图片的5个特征层待拼接的piifd张量 imgpiifdlist.append(concatenated) vob_end_time = datetime.now() print('Complete one image get vobhist, use time', (vob_end_time - start_time)) return imgpiifdlist

09-27

for i in range(roisall.shape[0]): # 处理每个 ROI ``` - 这种嵌套循环对每个锚框单独处理，无法利用 GPU 的大规模并行能力。 - 每次调用图像裁剪、灰度转换、特征提取等，形成严重的性能瓶颈。 #### （4）频繁...

【Python报错解决方案】AttributeError: int object has no attribute log

小猪课堂的博客

06-17

1万+

你很可能看到了这篇文章，但是不是很简洁 AttributeError: ‘int’ object has no attribute ‘log’ 来我们直接点报错代码 np.log(dt['good']/dt['bad']) 解决方案 np.log((dt['good']/dt['bad']).astype('float')) 结束~ 原因就是因为数据格式，之前是这个列是object，要改成base Python比R语言友好些喜欢的壮士请留下你的赞写于：北京 2020-06-16 ...

mmrotate简单使用

qq_43248104的博客

04-28

852

Datalabels0001.txt0002.txtimages0001.png0002.png分别是x1，y1，x2，y2，x3，y3，x4，y4，classes，其中最后一个数字不可缺少，0表示易识别，1表示难识别。

旋转框目标检测mmrotate v1.0.0rc1 之RTMDet训练DOTA的官方问题解析整理（四）

qq_41627642的博客

03-10

3114

无

mmsegmentation使用记录

m0_51540477的博客

03-11

2925

因为要用多个模型做对比实验，图方便就直接用了mmsegmentation代码库。我主要是跑了Mask2Former、Swin-UperNet和Segformer。简单记录一下。

一、基于MMrotate旋转目标框检测（安装说明与踩坑记录）

Java开发，人工智能，边缘计算，致力于掌握前沿技术

06-04

7669

MMRotate 是一款基于 PyTorch 的旋转框检测的开源工具箱，是 OpenMMLab 项目的成员之一。里面包含了rcnn、faster rcnn、r3det等各种旋转目标的检测模型，适合于遥感图像领域的目标检测。

mmdet 从2.x 模型代码迁移到3.x 记录(以mask rcnn 为例)

Magicapprentice的博客

12-13

2341

mmdet 2.x 模型到 mmdet 3.x

Windows10使用MMrotate（初学），并训练自己的数据集

weixin_40671801的博客

08-18

4289

使用window10配置mmrotate，并训练自己的数据集

mmrotate旋转目标检测框架的学习与使用

qq_45139003的博客

09-16

1万+

本文是mmrotate从环境配置到训练自己数据集的一个记录。主要分为以下几个部分：一、环境配置 1. 下载checkpoint文件 2. 运行demo 二、制作自己的数据集 1. 标注数据 2. 标签格式转换 3. 可视化数据集 4.数据集裁剪三、修改配置文件 1. 修改classes 2. 修改训练参数四、训练并测试 1. 训练编辑 2. 测试 3. 预测五、总结

记录一个C++操作8位影像的一个bug