
Python3机器学习实战
cxykk1217
这个作者很懒,什么都没留下…
展开
-
Pyhthon3《机器学习实战》学习笔记二:决策树
一 决策树 概述决策树(Decision Tree)算法是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。书中只讨论用于分类的决策树。 决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-then 规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。决策树的定义:分类决策树模型是一种描述对实例进行分类的树形结构。决策树由...原创 2018-08-06 22:31:41 · 899 阅读 · 0 评论 -
Pyhthon3《机器学习实战》学习笔记一:K-近邻算法
1 k-近邻法简介 k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相...原创 2018-08-02 22:10:28 · 572 阅读 · 0 评论 -
Pyhthon3《机器学习实战》学习笔记三:朴素贝叶斯
一 前言 前两章的KNN分类算法和决策树分类算法最终都是预测出实例的确定的分类结果,但是,有时候分类器会产生错误结果;本章要学的朴素贝叶斯分类算法则是给出一个最优的猜测结果,同时给出猜测的概率估计值。朴素贝叶斯是贝叶斯决策理论的一部分,所以在讲述朴素贝叶斯之前有必要快速了解一下贝叶斯决策理论。贝叶斯决策理论 假设现在我们有一个数据集,它由两类数据组成,数据分布如下图...原创 2018-09-07 19:46:27 · 472 阅读 · 0 评论 -
机器学习:AdaBoost算法
一、AdaBoost简介 Boosting, 也称为增强学习或提升法,是一种重要的集成学习技术, 能够将预测精度仅比随机猜度略高的弱学习器增强为预测精度高的强学习器,这在直接构造强学习器非常困难的情况下,为学习算法的设计提供了一种有效的新思路和新方法。其中最为成功应用的是,Yoav Freund和Robert Schapire在1995年提出的AdaBoost算法。 Ad...原创 2018-09-16 10:15:28 · 2488 阅读 · 1 评论 -
机器学习:GBDT(梯度提升决策树)
一 简介GBDT通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。因为训练的过程是通过降低偏差来不断提高最终分类器的精度。GBDT主要由三个概念组成:Regression Decistion Tree(即DT),Gradient Boosting(即GB),Shrinkage (算法的一个重要演进分...原创 2018-09-18 09:56:59 · 1019 阅读 · 0 评论 -
机器学习:随机森林
随机森林是一种重要的基于Bagging的集成学习方法,可以用来做分类、回归等问题。随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。 决策树相当于一个大师,通过自己在数据集中学到的知识用于新数据的分类。但是俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过单个大师的一种算法。1 什么是随机森林?如果读者接触过决策树(Decisi...原创 2018-09-14 16:50:12 · 703 阅读 · 0 评论