
机器学习
文章平均质量分 91
风弦鹤
此行若一去不回
那便一去不回
展开
-
准确率(Precision)、召回率(Recall)、F值(F-Measure)的简要说明
一般来说,precision是检索出来的条目(文档、网页)有多少是准确的;recall就是所有准确的条目有多少被检索出来了; 不妨举这样一个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下: 正确率 = 700 / (700 + 200 + 100) = 70% ...转载 2018-05-15 22:15:17 · 6521 阅读 · 0 评论 -
决策树算法——机器学习(理论+图解+python代码)
前言暑假打算吃透一本书叫《机器学习》,大家也亲切的叫它西瓜书,看完决策树这部分想做做总结,虽然几年前对决策树的知识就有点印象,但是我发现现在又有了很多新的收获。一、基本流程二、划分选择三、剪枝处理四、连续与缺失值五、多变量决策树六、房价数据集的决策树算法python实现 一、基本流程决策树(decision tree)是一类常见的机器学习算法,它是基于树结构...原创 2018-07-09 22:01:34 · 38057 阅读 · 16 评论 -
sklearn中的GridSearchCV()!python中模型里各种参数取值有它方便多了
最近看机器学习的教学视频,老师反复提到了一个函数GridSearchCV()。举个例子,在python中用一个模型的时候,可能会涉及一些需要人为指定的参数,比如随机森林模型需要指定min_samples_split=?、n_estimators=?,在我们缺乏先验知识的时候,我们是不知道取什么样的值才是合适的,这个时候GridSearchCV()函数就派上了用场。#简单的例子来看看GridSear...原创 2018-07-11 15:27:18 · 14152 阅读 · 0 评论 -
XGBoost——机器学习(理论+图解+安装方法+python代码)
目录一、集成算法思想二、XGBoost基本思想三、MacOS安装XGBoost四、用python实现XGBoost算法在竞赛题中经常会用到XGBoost算法,用这个算法通常会使我们模型的准确率有一个较大的提升。既然它效果这么好,那么它从头到尾做了一件什么事呢?以及它是怎么样去做的呢?我们先来直观的理解一下什么是XGBoost。XGBoost算法是和决策树算法联系到一起的。决...原创 2018-07-13 15:25:32 · 83686 阅读 · 18 评论 -
DBSCAN聚类算法——机器学习(理论+图解+python代码)
一、前言二、DBSCAN聚类算法三、参数选择四、DBSCAN算法迭代可视化展示五、常用的评估方法:轮廓系数六、用Python实现DBSCAN聚类算法一、前言去年学聚类算法的R语言的时候,有层次聚类、系统聚类、K-means聚类、K中心聚类,最后呢,被DBSCAN聚类算法迷上了,为什么呢,首先它可以发现任何形状的簇,其次我认为它的理论也是比较简单易懂的。今年在python...原创 2018-07-26 11:21:39 · 205944 阅读 · 43 评论 -
LightGBM——提升机器算法(图解+理论+安装方法+python代码)
前言LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。在竞赛题中,我们知道XGBoost算法非常热门,它是一种优秀的拉动框架,但是在使用过程中,其训练耗时很长,内存占用比较大。在2017年年1月微软在GitHub的上开源了一个新的升压工具--LightGBM。在不降低准确率的前提下,速度提升了10倍左右,占用内存...原创 2018-08-04 21:41:12 · 108277 阅读 · 23 评论 -
逻辑回归——机器学习(图解+理论+python实现)
目录前言一、Sigmoid函数(核心)二、确定最佳回归系数三、思路总结四、用Python实现逻辑回归算法前言逻辑回归虽然带有回归两字,但实际上是做分类任务的,并且是一个经典的二分类算法。在我们选择使用机器学习算法的时候,通常呢,首先考虑的就是逻辑回归算法,再去考虑另外复杂的算法,也就是说我们能用简单的还是用简单的算法。在机器学习中,算法不是越复杂越好,而是要简单、高效、...原创 2018-08-30 22:40:32 · 8195 阅读 · 2 评论