
机器学习
文章平均质量分 94
Sunning_001
这个作者很懒,什么都没留下…
展开
-
Hadoop伪分布式搭建及wordcount实验详细步骤
目录一、准备二、安装jdk三、安装Hadoop四、文件配置五 、wordcount文件下载hadoop-2.7.3.tar,vm15p,ubuntu-16.04.6-server-amd64,jdk-8u171-linux-x64.tar,Xftp-6.0.0169p,Xshell-6.0.0175p等为安装软件,请提前安装,下载地址链接:下载地址 提取码:s33d。一、准备1.1创建Hadoop用户 sudo useradd -m hadoop -s /bin...原创 2020-05-11 14:59:59 · 1024 阅读 · 0 评论 -
决策树详细解析
目录1、基本概念2、 决策树的构造2.1、ID3算法 / 信息熵2.2、C4.5算法 / 增益率2.3、CART算法 / 基尼指数3、剪枝操作4、 连续值与缺失值处理4.1、连续值离散化4.2、缺失值处理1、基本概念顾名思义,决策树是基于树结构来进行决策的,在网上看到一个例子十分有趣,放在这里正好合适。现想象一位捉急的母亲想要给自己的女娃介绍一个男朋友,...原创 2018-05-28 22:02:45 · 19574 阅读 · 3 评论 -
神经网络
目录1、神经元模型2、感知机与多层网络3、BP神经网络算法4、 全局最小与局部最小5、 深度学习在机器学习中,神经网络一般指的是“神经网络学习”,是机器学习与神经网络两个学科的交叉部分,是另一个经典的监督学习算法。所谓神经网络,目前用得最广泛的一个定义是“神经网络是由具有适应性(这里的适应性主要指权重和阈值的自动确定,即学习)的简单单元组成的广泛并行互连(某神经元,1与同层...原创 2018-08-02 17:48:01 · 846 阅读 · 0 评论 -
机器学习模型评估方法
目录1、基本概念 2、数据集划分方法 2.1、留出法2.2、交叉验证法2.3、自助法2.4、调参3、性能度量3.1、 查准率,查全率与F13.2、如何比较两学习器性能3.3、ROC、AUC和EER3.4、代价敏感错误率4、比较检验4.1、假设检验4.2、交叉验证t检验4.3、McNemar检验4.4、Friedman检验...原创 2018-05-22 23:08:37 · 13156 阅读 · 0 评论 -
线性模型
目录1、基本形式2、线性回归3、对数几率回归(逻辑回归)3.1、极大释然估计3.1.1、似然函数3.1.2、极大似然估计(MLE)3.1.3、log似然函数3.2、逻辑回归4、线性判别分析5、多分类学习问题6、类别不平衡问题1、基本形式给定有d个属性描述的示例;线性模型试图学得一个通过属性的线性组合来进行预测的函数,即:许多功能强大的非线...原创 2018-08-08 09:30:49 · 10587 阅读 · 0 评论 -
支持向量机
感知机是非常简单的线性二类分类器,是SVM的基础,原理就是找一个线性超平面来对训练数据进行划分,下面按照机器学习算法三要素的形式来介绍感知机。一、模型我们分别用+1、-1来标记正负类别,则模型可以表示为如下函数: si...原创 2018-08-08 15:33:58 · 399 阅读 · 0 评论 -
机器学习中的损失函数
目录损失函数一、log对数损失函数(逻辑回归)二、平方损失函数(最小二乘法, Ordinary Least Squares )三、指数损失函数(Adaboost)四、Hinge损失函数(SVM)五、其它损失函数损失函数损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示...转载 2018-09-06 21:03:36 · 1393 阅读 · 0 评论