新能源汽车图像分类-pytorch应用实践_汽车照片分类数据集-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_51657509/article/details/145300821

github:https://github.com/Giperx/ClassifySI

详见：https://blog.youkuaiyun.com/m0_51657509/article/details/145100225

新能源汽车图像分类 - ClassifySI 框架实践

区分 Taycan、WeiLai_ET7、XiangJie_S9、XiaoMi_SU7、XiaoPeng_P7、ZhiJie_S7 六类汽车图片。

准备

在 Ubuntu 18.04.6 LTS 平台，使用 python=3.8，torch==1.12.1+cu113，torchvision==0.13.1+cu113，cuda=11.3，训练设备使用 TitanXp（12GB）

数据集：下载地址

[ 已训练模型权重等 CheckPoint：下载地址 ]

共 6 类汽车图片，每类汽车 200 张，共计 1200 张。

python dataAugmSplit.py -raw ../../dataset-tmp/car -out ./data

-raw 指定好解压后的数据集位置，其它均使用了默认参数(prob_aa=0.45)。

dataAugmSplit.py 将数据集先划分为了 8：1：1，即每类图片划分为 160：20：20.划分使用train_test_split()，随机种子固定为random_state=42。对训练集增强 3 次，验证集增强 1 次。最后训练集共计 $160\times(3+1)\times 6=3840$ 张图片，验证集共计 $20\times(1+1)\times 6=240$ ，测试集共计 $20\times 6=120$ 。

### 训练

ResNet-18

# ResNet
from torchvision.models import ResNet18_Weights
class Classifier(nn.Module):
    def __init__(self, num_classes):
        super(Classifier, self).__init__()
        self.resnet = models.resnet18(weights=ResNet18_Weights.IMAGENET1K_V1)
        num_features = self.resnet.fc.in_features
        # 替换原始的全连接层
        self.resnet.fc = nn.Identity()  # 用一个恒等映射替换原始的全连接层
        self.fc1 = nn.Linear(num_features, 128)
        self.fc2 = nn.Linear(128, num_classes)

    def forward(self, x):
        x = self.resnet(x)
        x = self.fc1(x)
        x = torch.relu(x)
        return self.fc2(x)

python train.py -g 1 -sd 1024

使用单卡训练，默认 50epochs，固定随机数种子为 1024，使用默认批次大小 default=[32, 1]。TitanXp 共耗时 2h 左右，训练时占用显存 4800MB 左右。训练 log 如下所示：

训练曲线如下所示：

将保存的模型权重save_model/model.pth重命名为save_model/model_resnet.pth

MobileNetV2

# MobileNetV2
from torchvision.models import mobilenet_v2, MobileNet_V2_Weights
class Classifier(nn.Module):
    def __init__(self, num_classes):
        super(Classifier, self).__init__()
        self.model = models.mobilenet_v2(weights=MobileNet_V2_Weights.IMAGENET1K_V1)
        self.model.classifier[1] = nn.Linear(self.model.last_channel, num_classes)

    def forward(self, x):
        return self.model(x)

python train.py -g 1 -sd 1024

使用单卡训练，默认 50epochs，固定随机数种子为 1024，使用默认批次大小 default=[32, 1]。TitanXp 共耗时 2.5h 左右，训练时占用显存 11700MB 左右。训练 log 如下所示：

训练曲线如下所示：

将保存的模型权重save_model/model.pth重命名为save_model/model_mobilenet.pth

测试

ResNet-18

python test.py -m ./save_model/model_resnet.pth

使用 TitanXp 进行测试，测试结果如下所示：

ConfusionMatrix_test_wo_20250120_223437_resnet_45

输出的模型准确率 Accuracy、F1 Score，各类精确率 Precision、召回率 Recall、特异度 Specificity、F1 Score，模型参数量，推理速度如下所示：

将保存的整个模型文件save_model/model_all.model重命名为save_model/model_all_resnet.model

MobileNetV2

python test.py -m ./save_model/model_mobilenet.pth

使用 TitanXp 进行测试，测试结果如下所示：

ConfusionMatrix_test_wo_20250120_230800_mobilenet_45

输出的模型准确率 Accuracy、F1 Score，各类精确率 Precision、召回率 Recall、特异度 Specificity、F1 Score，模型参数量，推理速度如下所示：

将保存的整个模型文件save_model/model_all.model重命名为save_model/model_all_mobilenet.model

导入Netron中进行可视化：

	ResNet-18	MobileNetV2
带权重参数	model_all_resnet_weight.png	model_all_mobilenet_weight.png
不带参数	model_all_resnet.png	model_all_mobilenet.png

为探究数据增强部分 AutoAugment 策略和中心最大化裁剪CenterCrop对模型分类性能的影响，采用对比实验，分别使用 0%、45%、100%三种增强比例对数据集进行增强。划分时train_test_split()固定随机种子random_state=42。其它参数使用默认值。

使用AutoAugment 策略增强后的图片如下所示：

python dataAugmSplit.py -out ./data_0 -p 0.

python dataAugmSplit.py -out ./data_45 -p 0.45

python dataAugmSplit.py -out ./data_1 -p 1.

对于两个模型训练时都将随机数种子-sd固定为 1024 训练和测试。

测试结果如下：

train_w 表示在train.py和中get_transforms()函数中使用了CenterCrop，先进行中心化最大裁剪为正方形；train_wo 表示训练时未使用CenterCrop。

test_w 表示在test.py测试时使用了CenterCrop；test_wo 表示测试时未使用CenterCrop。

def get_transforms():
    # Define image transformations
    CenterCrop = transforms.Lambda(lambda image: center_crop(image))
    transform = transforms.Compose([
        CenterCrop, # max Center crop
        transforms.Resize((448, 448)),
        transforms.ToTensor(),
        transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
    ])
    return transform