李宏毅2022机器学习hw3

最新推荐文章于 2023-10-07 17:54:45 发布

原创

最新推荐文章于 2023-10-07 17:54:45 发布 · 742 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #深度学习

这篇博客记录了作者在李宏毅机器学习课程HW3中进行的图像分类任务，包括简单线性模型、中等基线、强基线和Boss基线的实现。通过数据增强、残差网络、预训练参数、交叉验证和ensemble策略提高模型性能，最终在Boss基线上取得超过0.88的准确率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2.1 Simple line (acc>0.50099)

2.2 Medium Baseline (acc>0.73207)

2.3 Strong Baseline (acc>0.81872)

模型设计，采用残差神经网络。

2.4 Boss Baseline (acc>0.88446)

Machine Learning HW3

任务

图像分类

数据下载

百度网盘：

链接：https://pan.baidu.com/s/1gEiw4nIYDA4puMIhqBI5Og?pwd=pwyl
提取码：pwyl

结果

全过strong baselin，public score与bossline差0.2

改进方法

2.1 Simple line (acc>0.50099)

运行课程上给的基础代码

2.2 Medium Baseline (acc>0.73207)

对数据集进行数据增强，并训练更长的时间，这里的图像变换，一是可以增强模型的鲁棒性，二是可以用于进一步扩充数据集，使得我们的训练集得到扩充。

test_tfm = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
])

# 对于训练图片做处理，数据增强，常用的几种有效数据增强方法：
train_tfm = transforms.Compose([
    # Resize the image into a fixed shape (height = width = 128)
    transforms.Resize((128, 128)),

    # You may add some transforms here.
    transforms.RandomHorizontalFlip(p=0.5),  # 50%的概率水平翻转
    transforms.RandomVerticalFlip(p=0.5),  # 50%的概率垂直翻转
    transforms.RandomCrop(128, padding=10),#填充剪裁
    # transforms.RandomGrayscale(p=0.1)  #根据概率转灰度channel=1，CNN中in_channel=3，不可行
    trans

最低0.47元/天解锁文章