BigData
matthewfjnd
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ROC和AUC介绍以及如何计算AUC
原帖转自:https://www.douban.com/note/284051363/ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对两者的简单介绍见这里。这篇博文简单介绍ROC和AUC的特点,以及更为深入地,讨论如何作出ROC曲线图以及计算AUC。ROC曲线需要提前说明的是,我...转载 2018-10-08 22:16:38 · 235 阅读 · 0 评论 -
HCIE-BigData学习笔记-支持向量机
1、华为MLS分类模型中数据的查看真伪阴真阴伪阴阳真阳伪阳2、要将所要结果输出伪目标3、惩罚系数当我们构建出最大超平面的时候,本来是输入属性,经过判断之后,它是属于不存款的一边,但是真实是存款的,我们就可以改变惩罚系数来将本来落在不存款一边的数据变成存款的,惩罚系数越大,拟合的越多,参数调整的好,可以解决欠拟合(over-fitting )问题,调整...原创 2018-11-07 11:35:19 · 813 阅读 · 0 评论 -
HCIE-BigData学习笔记-数据挖掘预测建模概念
分类和回归是预测问题的两种主要类型,分类的输出是离散的类别值, 而回归的输出是连续数值。分类构造一个模型或分类器(Classifer)来预测类标号。数据分类是一个两阶段过程:学习阶段:建立描述预先定义的数据类或概念集的分类器。分类算法通过分析或从训练集“学习”来构造分类器。若训练集中每个训练元组的均有类标号,这一阶段也称为监督学习;若训练集中每个训练元组都没有类标号,称为无监督学习;...原创 2018-11-07 15:17:07 · 523 阅读 · 0 评论 -
HCIE-BigData学习笔记-回归模型
评估参数解释MAE:平均绝对误差,就是预测出来的数值减去真实的数值,然后将所有数值加一起,再除以样本数量。比如:样本中有 100 条数据,用其中 66 条作为算法的训练,然后将 34 条数据输入后,得到 34 个结果,这个预测的每个结果减去每个数据真实的结果,再将这些减完的 34 个结果相加,再除以 34,都得到平均绝对误差。MSE:均方误差,就是预测出来的数值减去真实的数值再平方,然后将所有...转载 2018-11-07 15:50:29 · 701 阅读 · 0 评论 -
HCIE-BigData学习笔记-分类与聚类
简单地说分类就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有标签而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是:分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练语料训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确定。 聚类不需要人工标注和预先训练分类器,类别在聚类过程中自动生成 (类的数量提前确定)。分类适合类别或分类体...转载 2018-11-07 15:54:23 · 1004 阅读 · 0 评论
分享