思路
1. 分析
1.1 题目解析
(1) kaggle上比赛的题目解析:
五种表情:惊讶、愤怒、高兴、悲伤和中性(已经剔除数量较少的厌恶和恐惧)
评估指标:ACC(准确率) 和 AUC
(2)表情识别很多难点,表现在两个方面:
- 易受到其它因素的影响,比如环境、光照和姿态等
- 各种表情的程度不一样
1.2 数据探索
1.2.1 数据存储方式
形式一:每个文件夹放一个种类的图片
形式二:两个文件夹,一个文件夹放图片(非结构化数据),另外一个CSV文件存储标签和路径
经验:形式一只适合数量少的数据,而且只能做分类任务;形式二更加合理,方便管理和分布式存储
1.2.2 数据探索工具
探索的内容:数据的数量、是否有类别不均、文件格式等等。
方法一:Linux 的 bash脚本,直接在终端中编程进行探索

方法二:python脚本(更常用)

还可以加入更复杂的逻辑,例如查看文件后缀等。

本文深入解析Kaggle表情识别竞赛,探讨数据探索、预处理及模型构建策略。针对表情识别难点,提出有效解决方案,包括数据预处理技巧和深度学习模型构建,旨在提高准确率和AUC指标。
最低0.47元/天 解锁文章
1003

被折叠的 条评论
为什么被折叠?



