tricks:图像分类涨点

本文针对多个图像分类竞赛,包括Intel Image Classification及Diabetic Retinopathy Detection等,详细介绍了数据预处理、模型选择与优化以及损失函数调整等关键步骤。特别强调了如何通过数据增强和模型调参提升模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文:https://mp.weixin.qq.com/s/mIBhQitG_BbPZlbByc-GqQ

涉及比赛:

  1. Intel Image Classification:https://www.kaggle.com/puneet6060/intel-image-classification
  2. Recursion Cellular Image Classification:https://www.kaggle.com/c/recursion-cellular-image-classification
  3. SIIM-ISIC Melanoma Classification:https://www.kaggle.com/c/siim-isic-melanoma-classification
  4. APTOS 2019 Blindness Detection:https://www.kaggle.com/c/aptos2019-blindness-detection/notebooks
  5. Diabetic Retinopathy Detection:https://www.kaggle.com/c/diabetic-retinopathy-detection
  6. ML Project — Image Classification:https://www.kaggle.com/c/image-classification-fashion-mnist/notebooks
  7. Cdiscount’s Image Classification Challenge:https://www.kaggle.com/c/cdiscount-image-classification-challenge/notebooks
  8. Plant seedlings classifications:https://www.kaggle.com/c/plant-seedlings-classification/notebooks
  9. Aesthetic Visual Analysis:https://www.kaggle.com/c/aesthetic-visual-analysis/notebooks

涉及方向:
数据、模型、损失函数

可修改目录如下(具体见链接):
一、数据:
1、数据预处理:提高图像质量,以便更好处理
2、EDA:分析并总结数据集特征
3、数据增强:生成更多图像

二、模型:
1、较好的baseline模型:如efficientnet、inception等
2、训练过程
3、超参数调试
4、正则化

三、损失函数:
1、常用损失函数
2、评估+错误分析

具体:
一、数据:
1、数据预处理:提高图像质量,以便更好处理
2、EDA:分析并总结数据集特征
3、数据增强:生成更多图像

二、模型:
1、较好的baseline模型:如efficientnet、inception等
在这里插入图片描述

2、训练过程
在这里插入图片描述

3、超参数调试
即学习率、epoch的数量、hidden units的数量、batch size大小等
可以通过使用hyperparameter调优库,比如Scikit learn Grid Search,Keras Tuner来自动化这个过程,而不是去手动配置。这些库会在你指定的范围内尝试所有的hyperparameter组合,返回表现最好的模型。

4、正则化
Adding or changing the position of Batch Norm: https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
Weight regularization:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
Gradient clipping:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline

三、损失函数:
1、常用损失函数
在这里插入图片描述

2、评估+错误分析
TTA:https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb
Grad CAM:https://arxiv.org/pdf/1610.02391v1.pdf
Tracking metrics and Confusion matrix:https://www.kaggle.com/vincee/intel-image-classification-cnn-keras

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值