写在前面
随着人工智能时代的到来,机器学习已成为解决问题的关键工具,如识别预测疾病风险等。Python是实现机器学习的热门语言之一。接下来会详细介绍机器学习如何应用到实际问题,并概括通过Python进行实际操作。
一般建立机器学习的流程如下:
数据选择是准备机器学习的关键,其中机器学习广泛流传一句话:数据和特征决定了机器学习结果的上限,而模型算法只是尽可能逼近这个上限
,意味着数据及其特征表示的质量决定了模型的最终效果,且在实际应用中,算法通常占了很小的一部分,大部分的工作都是在找数据、提炼数据、分析数据及特征工程。
image.png
所以,数据质量差或无代表性,会导致模型拟合效果差。
本文是针对于[模型构建],[模型评估]
部分,展示在Python里构建机器学习模型,并对模型进行评估。
乳腺癌预测
本例选用的是sklearn上的数据集版本:Breast Cancer Wisconsin DataSe