机器学习数据理解与分类问题分析
在机器学习领域,理解数据是解决问题的关键一步。下面将详细介绍如何通过理解数据来明确问题,并以“Rocks versus Mines”数据集为例,深入探讨分类问题的处理方法。
新问题的数据剖析
机器学习算法通常从一个包含数字和字符变量的矩阵(或表格)开始。以预测个人明年在线购书花费为例,数据以行和列的形式排列,每行代表一个个体案例,每列有其特定作用。
| USERID | ATTRIBUTE 1 | ATTRIBUTE 2 | ATTRIBUTE 3 | LABELS |
|---|---|---|---|---|
| 001 | 6.5 | Male | 12 | $120 |
| 004 | 4.2 | Female | 17 | $270 |
| 007 | 5.7 | Male | 3 | $75 |
| 008 | 5.8 | Female | 8 < |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



