上一章主要介绍了几个python 常用的机器学习包。这一章主要介绍scikit-learn相关的内容,这个机器学习包官方文档介绍比较详细,不过都是英文版的介绍。下面要具体的分几章进行介绍。
第1章,机器学习基础,将机器学习定义成一种通过学习经验改善工作效果的程序研究与设计过程。
第2章,线性回归,介绍线性回归模型,一种解释变量和模型参数与连续的响应变量相关的模型。通过最小二乘法求解模型参数获得最优模型。第3章,特征提取与处理,介绍了常见的机器学习对象如文本,图像与分类变量的特征提取与处理方法。
第4章,从线性回归到逻辑回归,介绍广义线性回归模型如何解决分类任务。将逻辑回归模型与特征提取技术结合起来实现一个垃圾短信分类器。
第5章,决策树——非线性回归与分类,介绍了一种回归和分类的非线性模型——决策树。用决策树集成方法实现了一个网页广告图片屏蔽器。
第6章,K-Means聚类,介绍非监督学习的K-Means聚类算法,并与逻辑回归组合起来实现一个照片分类器。
第7章,用PCA降维,介绍另一种非监督学习任务——降维。我们用主成分分析实现高维数据的可视化,建立一个脸部识别器。
第8章,感知器,介绍一种实时的,二元分类器——感知器。
第9章,从感知器到支持向量机,介绍支持向量机,是一种有效的非线性回归与分类模型。我们用支持向量机识别街景照片中的字母。
第10章,从感知器到人工神经网络,介绍了人工神经网络,是一种强大的有效的非线性回归与分类模型。我们用人工神经网络识别手写数字。