首先考虑使用机器学习算法的目的。如果想要预测目标变量的值,则可以选择监督学习算法,否则可以选择无监督学习算法。
确定选择监督学习算法后,需要进一步确定目标变量类型,如果目标变量是离散值,如是/否,则可以选择分类算法;如果目标变量时连续性数值,如0.0-100.00,需要选择回归算法;
如果不想预测目标变量的值,则可以选择无监督学习算法。进一步分析是否需要将数据划分为离散的组。这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。
首先考虑使用机器学习算法的目的。如果想要预测目标变量的值,则可以选择监督学习算法,否则可以选择无监督学习算法。
确定选择监督学习算法后,需要进一步确定目标变量类型,如果目标变量是离散值,如是/否,则可以选择分类算法;如果目标变量时连续性数值,如0.0-100.00,需要选择回归算法;
如果不想预测目标变量的值,则可以选择无监督学习算法。进一步分析是否需要将数据划分为离散的组。这是唯一的需求,则使用聚类算法;如果还需要估计数据与每个分组的相似程度,则需要使用密度估计算法。