机器学习笔记
文章平均质量分 72
初学机器学习时,根据李航老师的《统计学习方法》做的笔记,实战代码参考《Python机器学习及实践:从零开始通往Kaggle竞赛之路》。
Quanfita
这个作者很懒,什么都没留下…
展开
-
机器学习入门实战——感知机算法实战Iris数据集
感知机算法实战Iris数据集关于感知机的相关理论知识请查看:感知机关于Iris数据集 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。 Iris...原创 2018-02-25 16:02:50 · 11606 阅读 · 1 评论 -
机器学习入门之《统计学习方法》笔记整理——K近邻法
目录k近邻算法算法 k近邻法k近邻模型距离度量k值选择分类决策规则k近邻法的实现kd树构造kd树算法 构造平衡kd树搜索kd树算法 用kd树的最近邻搜索小结参考文章k近邻算法 k近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该...原创 2018-02-12 13:03:14 · 1094 阅读 · 0 评论 -
机器学习入门实战——KNN实战Iris数据集
KNN实战Iris数据集关于KNN的相关理论知识请查看:KNN关于Iris数据集的相关信息可查看我的上一篇博客:感知机算法实战Iris数据集接下来的实战我们将使用sklearn库代码实战首先,我们还是先导入数据集from sklearn.datasets import load_irisiris = load_iris()iris.data.shape ...原创 2018-02-25 16:22:46 · 2873 阅读 · 0 评论 -
机器学习入门之《统计学习方法》笔记——朴素贝叶斯法
朴素贝叶斯(naive Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。目录朴素贝叶斯法参数估计极大似然估计学习与分类算法算法 朴素贝叶斯算法贝叶斯估计小结参考文章朴素贝叶斯法 设输入空间X⊆RnX⊆RnX\subseteq \mathbb{R}^n 为nnn 维向量的集合,输出空间为类标记集合Y={c1,c2,.....原创 2018-02-21 19:55:58 · 849 阅读 · 0 评论 -
机器学习入门实战——朴素贝叶斯实战新闻组数据集
朴素贝叶斯实战新闻组数据集关于朴素贝叶斯的相关理论知识可查看:朴素贝叶斯法关于新闻组数据集20newsgroups数据集是用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。一些新闻组的主题特别相似(e.g. comp.sys.ibm.pc.hardware/comp.sys.mac.hardware),还有一些却完全不相关 (e.g misc.forsale /soc.reli...原创 2018-02-25 21:23:32 · 1821 阅读 · 0 评论 -
机器学习入门实战——决策树算法实战Titanic数据集
关于决策树的理论知识可以查看:决策树Titanic数据集概述 RMS泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。 1912年4月15日,在首航期间,泰坦尼克号撞上一座冰山后沉没,2224名乘客和机组人员中有1502人遇难。这一耸人听闻的悲剧震撼了国际社会,导致了更好的船舶安全条例。预测是否有乘客幸存下来的泰坦尼克号。代码实战首先,一如既往导入数据集,并查看一下部分数据...原创 2018-03-22 20:41:01 · 5015 阅读 · 0 评论 -
机器学习入门实战——线性支持向量机实战digits数据集
关于支持向量机的理论知识查看:支持向量机digits数据集概述digits.data:手写数字特征向量数据集,每一个元素都是一个64维的特征向量。digits.target:特征向量对应的标记,每一个元素都是自然是0-9的数字。digits.images:对应着data中的数据,每一个元素都是8*8的二维数组,其元素代表的是灰度值,转化为以为是便是特征向量。代码实战...原创 2018-04-28 09:49:18 · 1995 阅读 · 0 评论 -
机器学习入门实战——逻辑斯谛回归实战breast cancer数据集
更多有关逻辑斯谛回归的理论知识查看:逻辑斯谛回归代码实战首先,我们还是先将需要用到的库导入,应为此数据集缺少名称,所以,使用pandas导入数据时,我们需要手动添加名称import pandas as pdimport numpy as npimport tensorflow as tfcolumn_names = ['Sample code number','Clump...原创 2018-04-28 09:45:48 · 3143 阅读 · 2 评论 -
机器学习入门之《统计学习方法》笔记整理——感知机
从头开始学习李航老师的《统计学习方法》,这本书写的很好,非常适合机器学习入门。 如果部分显示格式有问题请移步Quanfita的博客查看目录感知机模型感知机学习策略感知机学习算法原始形式算法1 感知机学习算法的原始形式算法的收敛性对偶形式算法2 感知机学习算法的对偶形式小结参考文章感知机模型 什么是感知机?感知...原创 2018-02-11 22:14:00 · 8889 阅读 · 2 评论 -
机器学习入门实战——支持向量机实战Boston房价数据集
更多支持向量机的理论知识查看:支持向量机 该数据集来源于1978年美国某经济学杂志上。该数据集包含若干波士顿房屋的价格及其各项数据,每个数据项包含14个数据,分别是房屋均价及周边犯罪率、是否在河边等相关信息,其中最后一个数据是房屋均价。代码实战这里我们说简单点儿,我们从sklearn中的datasets中导入数据集,导入需要的库,将数据集进行划分,再标准化from sk...原创 2018-04-28 09:52:05 · 2898 阅读 · 0 评论 -
机器学习入门之《统计学习方法》笔记整理——最大熵模型
最大熵模型目录最大熵模型最大熵原理最大熵模型的定义最大熵模型的学习模型学习的最优化算法算法 (改进的迭代尺度算法IIS)算法 (最大熵模型学习的BFGS算法)小结参考文章最大熵原理 最大熵原理是概率模型学习的一个准则,最大熵原理认为,学习概率模型时,在所有的可能的概率模型中,熵最大的模型是最好的模型。通常用约束条件来确定概率模型的集...原创 2018-03-03 18:19:47 · 636 阅读 · 0 评论 -
机器学习入门之《统计学习方法》笔记整理——逻辑斯谛回归
逻辑回归(logistic regression)是统计学习中的经典分类方法。其多用在二分类{0,1}问题上。最大嫡是概率模型学习的一个准则将其推广到分类问题得到最大熵模型(maximum entropy model)。逻辑回归模型与最大熵模型都属于对数线性模型。目录逻辑斯谛回归模型逻辑斯谛分布二项逻辑斯谛回归模型模型参数估计多项逻辑斯谛回归参考文章...原创 2018-03-04 08:36:59 · 540 阅读 · 0 评论 -
机器学习入门之《统计学习方法》笔记整理——支持向量机
支持向量机 支持向量机(support vector machines, SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划(convex quadratic programming)的问题,也等价于正则化的合页损失函数的最小化问。支持向量机...原创 2018-03-08 19:45:44 · 915 阅读 · 0 评论 -
机器学习入门之《统计学习方法》笔记整理——提升方法
提升方法的思路是综合多个分类器,得到更准确的分类结果。 说白了就是“三个臭皮匠顶个诸葛亮”。目录提升方法提升方法AdaBoost算法算法 (AdaBoost)AdaBoost算法的解释前向分步算法算法 (前向分步算法)前向分步算法与AdaBoost提升树提升树模型提升树算法算法 (回归问题的提升树算法)算法 (梯度提升算法)参考...原创 2018-03-08 21:26:47 · 624 阅读 · 0 评论