nx上darknet的使用-图像分类-自定义训练、预测和遇到的问题

Suyuoa

已于 2025-04-14 09:31:19 修改

阅读量1k

点赞数 22

分类专栏： Jetson Xavier NX上的操作文章标签：分类人工智能

于 2024-10-29 16:50:37 首次发布

本文链接：https://blog.youkuaiyun.com/potato123232/article/details/143334477

版权

Jetson Xavier NX上的操作专栏收录该内容

20 篇文章

订阅专栏

参考

https://zhuanlan.zhihu.com/p/60607178

Survival Strategies for the Robot Rebellion

与其道听途说，不如少走点弯路，轻松跟我来全面剖析 darknet 官网！_darknetguanwnag-优快云博客

2.3 custom_training.data

1 准备数据集

搞一个名为dataset的文件夹

里面有四个子文件夹，子文件夹的名称是标签的名称，里面放着对应标签的图像。我们这里选择飞机、湖泊、猫、狗各500张图像进行训练

子文件夹的图像文件名格式为 [类别名]_ID

我们简单看一下另外三个种类

也可以不像我上面那样命名，只需要修改 darknet/src/data.c 就行了，具体的就该方法在最后遇到问题的第一个有写

2 创建训练文件夹

首先在darknet目录下创建custom_classification这个文件夹

custom_classification中包含如下文件

下面我们说一下每个文件的内容

2.1 dataset

dataset是数据集，也就是我们准备的4类图像

2.2 trained_models

这个文件夹是空的，里面要放训练好的模型

2.3 custom_training.data

是一个文本文档，用gedit就能创建，创建后改个尾缀就行

打开后有如下内容

classes 种类数
train 训练集图片路径
valid 测试集图片路径
labels 标签名称
backup 训练后模型存放路径

在data中设置top这个键在训练中是没有用的，在测试中有用。如果设置为top=5，那么在测试的时候会给出5个置信最高的结果

2.4 get_train_val.py

功能是创建test.list与train.list这两个文件

代码的意思是把dataset中所有图像的绝对路径放到列表里 -> 随机列表顺序 -> 把随机后的列表写到test.list与train.list中

import os
import random

train_file_list = []
val_file_list = []

folder_list = os.listdir('/home/suyu/darknet/custom_classification/dataset/')
for folder_name in folder_list:
    a = 0
    for filename in os.listdir('dataset/' + folder_name):
        print(filename)
        if a < len(os.listdir('dataset/' + folder_name))*0.8: #train
            train_file_list.append('/home/suyu/darknet/custom_classification/dataset/' + folder_name + '/' + filename)
        else: #test
            val_file_list.append('/home/suyu/darknet/custom_classification/dataset/' + folder_name + '/' + filename)
        a = a + 1


random.shuffle(train_file_list)
random.shuffle(val_file_list)

train_txt = open('train.list','w')
for i in train_file_list:
    print(i)
    print(i,file=train_txt,flush=True)

val_txt = open('test.list','w')
for j in val_file_list:
    print(j)
    print(j,file=val_txt,flush=True)

2.5 labels.txt

内容为四个标签的名称

2.6 my.cfg

是训练用的神经网络，我在使用darknet框架的imagenet数据分类预训练操作-腾讯云开发者社区-腾讯云抄的

darknet中提供的VGG,alexnet等cfg训练出来效果不好

[net]
#Training
batch=16
subdivisions=1
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1
max_crop = 512
learning_rate=0.001
burn_in=1000
max_batches = 8000
policy=steps
steps=6400,7200
scales=.1,.1
[convolutional]
batch_normalize=1
filters=16
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[convolutional]
batch_normalize=1
filters=32
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=32
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[convolutional]
batch_normalize=1
filters=128
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=64
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=128
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=128
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=128
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky
[maxpool]
size=2
stride=2
[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=128
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=128
size=1
stride=1
pad=1
activation=leaky
[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky
#######
[convolutional]
batch_normalize=1
size=1
stride=1
pad=1
filters=128
activation=leaky
[convolutional]
batch_normalize=1
size=3
stride=1
pad=1
filters=256
activation=leaky
[convolutional]
batch_normalize=1
size=3
stride=1
pad=1
filters=256
activation=leaky
[convolutional]
filters=4
size=1
stride=1
pad=1
activation=leaky
[avgpool]
[softmax]
groups = 1
[cost]
type=sse

至少需要修改的有这样几个地方