垃圾分类图像数据集与卷积神经网络实现
该项目是一个开源的垃圾图像分类数据集及其基于卷积神经网络(CNN)的实现。主要编程语言为Lua和Python。
项目基础介绍
该项目由Gary Thung创建,旨在为垃圾图像分类提供一个数据集和基于Torch框架的卷积神经网络模型。数据集包含六类垃圾:玻璃、纸张、纸板、塑料、金属和其他垃圾。数据集由2527张图片组成,这些图片是通过将对象放置在白色海报板上,并使用阳光或室内照明拍摄的。图片已被缩放到512x384像素。
核心功能
项目的核心功能是提供了一个用于垃圾图像分类的数据集和一个基于Torch的卷积神经网络模型。具体功能包括:
- 数据集:包含六类垃圾的图像,可用于训练和测试机器学习模型。
- 卷积神经网络:使用Torch框架实现的CNN,用于对垃圾图像进行分类。
- 数据预处理:Python脚本用于图像预处理,如调整大小等。
最近更新的功能
根据项目README文件的最新更新,以下是一些最近添加或改进的功能:
- 权重初始化:模型现在使用Kaiming方法初始化权重,这提高了测试准确度,达到了约75%。
- 数据集更新:项目包含了一个更新的数据集,原始数据集大小超过了git-lfs的最大限制,因此已上传到Google Drive。
- 使用说明:增加了更详细的使用说明,包括数据准备、模型训练、测试和结果查看的步骤。
- Lua包管理:提供了详细的Lua环境设置和包安装说明,包括对CUDA支持的实施。
请注意,项目仍在开发中,README文件中还有一些待办事项,如完善使用说明、添加特定结果和参数、保存混淆矩阵数据以及重写数据预处理脚本等。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考