数据挖掘中的分类问题求解一般采用机器学习类算法,这些算法通过学习一些数据集的特征属性并将其应用于新的数据。这需要使用算法时要把数据分成两部分。一部分称之为训练集,用以学习数据的特征属性,这部分数据需要人工标定,为数据生成标签。另一部分称为测试集,测试集不需要人工处理。
数据挖掘中的分类问题求解一般采用机器学习类算法,这些算法通过学习一些数据集的特征属性并将其应用于新的数据。这需要使用算法时要把数据分成两部分。一部分称之为训练集,用以学习数据的特征属性,这部分数据需要人工标定,为数据生成标签。另一部分称为测试集,测试集不需要人工处理。