
机器学习
binbigdata
这个作者很懒,什么都没留下…
展开
-
机器学习之特征选择
机器学习之特征选择特征选择方法初识:1、为什么要做特征选择在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差。2、特征选择的确切含义将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。3、特征选取的原则获取尽可能小的特征子集,不显著降低分类精度、不影响类分布以及特征子集应具有稳定适应性强等特点主要有三种方...原创 2018-04-08 19:02:50 · 551 阅读 · 0 评论 -
朴素贝叶斯理论推导与三种常见模型
朴素贝叶斯理论推导与三种常见模型2015年09月09日 21:41:03 wepon_ 阅读数:33829 标签: 朴素贝叶斯分类器Python实现多项式模型高斯模型伯努利模型 更多个人分类: Machine Learning版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/u012162613/article/details/48323...转载 2018-11-27 19:50:13 · 551 阅读 · 0 评论 -
数据预处理(方法总结)
数据预处理(方法总结)转自-https://www.cnblogs.com/sherial/archive/2018/03/07/8522405.html一、概述在工程实践中,我们得到的数据会存在有缺失值、重复值等,在使用之前需要进行数据预处理。数据预处理没有标准的流程,通常针对不同的任务和数据集属性的不同而不同。数据预处理的常用流程为:去除唯一属性、处理缺失值、属性编码、数据标准化正...转载 2018-11-27 14:34:44 · 130252 阅读 · 0 评论 -
xgboost的原理没你想像的那么难
xgboost 已然火爆机器学习圈,相信不少朋友都使用过。要想彻底掌握xgboost,就必须搞懂其内部的模型原理。这样才能将各个参数对应到模型内部,进而理解参数的含义,根据需要进行调参。本文的目的就是让大家尽可能轻松地理解其内部原理。主要参考文献是陈天奇的这篇文章introduction to xgboost。在我看来,这篇文章是介绍xgboost最好的,没有之一。英语好的同学建议直接看英文,若...转载 2018-11-29 11:53:32 · 539 阅读 · 0 评论 -
深入理解感知机
1.模型感知机的模型如下图所示:公式表示如下所示:f(x)=sign(w⋅x+b)sign(x)={+1−1x≥0x<0f(x)=sign(w⋅x+b)sign(x)={+1x≥0−1x<0对于该分类器,其假设空间为特征空间的所有线性分类器,从几何学的角度可以理解为是特征空间中所有的超平面。那么,只要样本在特征空间中是线性可分的(可以被一个超平面完美划分),由感知机...转载 2018-11-29 11:43:47 · 334 阅读 · 0 评论 -
K-近邻算法(KNN)
最近在看《机器学习实战》这本书,因为自己本身很想深入的了解机器学习算法,加之想学python,就在朋友的推荐之下选择了这本书进行学习。 一 . K-近邻算法(KNN) 最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与...转载 2018-11-29 11:39:55 · 214 阅读 · 0 评论 -
【机器学习】EM算法详细推导和讲解
众所周知,极大似然估计是一种应用很广泛的参数估计方法。例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的方法可以估计出高斯分布的两个参数,均值和方差。这个方法基本上所有概率课本上都会讲,我这就不多说了,不清楚的请百度。 然而现在我面临的是这种情况,我手上的数据是四川人和东北人的身高合集,然而对于其中具体的每一个数据,并没有标定出它来自“东北人”还是“...转载 2018-11-29 11:38:51 · 215 阅读 · 0 评论 -
数据预处理
数据预处理:独热编码(One-Hot Encoding)和 LabelEncoder标签编码一、问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。离散特征的编码分为两种情况: 1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使...转载 2018-11-22 16:39:13 · 357 阅读 · 1 评论 -
条件随机场(CRF) - 4 - 学习方法和预测算法(维特比算法)
条件随机场(CRF) - 4 - 学习方法和预测算法(维特比算法) 2016年05月25日 15:57:51 阅读数:18745 声明: 1,本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结,不得用作商用,欢迎转载,但请注明出处(即:本帖地址)。 2,由于本人在学习初始时有很多数学知识都已忘记,所以为了弄懂其中的内容查阅了很多资料,所以里面应该会有引用其...原创 2018-07-08 20:43:24 · 593 阅读 · 0 评论 -
值得关注的机器学习博客
Physcalの大魔導書http://www.cnblogs.com/neopenx/category/656645.html仙道菜http://blog.youkuaiyun.com/cyh24/article/category/2767185以下转自 http://blog.youkuaiyun.com/lzy272942518/article/details/51200259,未一一验证1、小魏的修行路 http...转载 2018-06-10 15:42:11 · 1045 阅读 · 1 评论 -
这是机器学习算法工程师最好的时代
这是机器学习算法工程师最好的时代芝士来了 深度学习与NLP 4月11日对人工智能而言,2017是不平凡的一年:AlphaGo再胜人类腾讯宣布进军AI百度无人驾驶汽车上五环AI教育要从娃娃抓起寒武纪成全球AI芯片首个独角兽阿里巴巴成立达摩院类人机器人Sophia首获公民身份国家正式公布人工智能四大平台..........近年来,人工智能技术在各行各业中的应用越来越普及,相关专业技术人才也是供不应求,...转载 2018-06-15 14:49:39 · 290 阅读 · 0 评论 -
不同的领域、框架,这是一份超全的深度学习模型GitHub集合-转自机器之心
不同的领域、框架,这是一份超全的深度学习模型GitHub集合 ...原创 2018-06-15 10:13:24 · 531 阅读 · 0 评论 -
GAN学习指南:从原理入门到制作生成Demo,总共分几步
GAN学习指南:从原理入门到制作生成Demo,总共分几步? 本文作者:何之源 2017-01-22 10:10 导语:本文介绍下GAN和DCGAN的原理,以及如何使用Tensorflow做一个简单的生成图片的demo。 雷锋网注:本文作者何之源,复旦大学计算机科学硕士在读,研究人工智能计算机视觉方向。本文由雷锋网(公众号:雷锋网)编辑整理自作者知乎专栏,获授权发布。生成式对抗网络(...转载 2018-06-08 11:13:41 · 490 阅读 · 0 评论 -
xgboost入门与实战(实战调参篇)
xgboost入门与实战(实战调参篇)前言前面几篇博文都在学习原理知识,是时候上数据上模型跑一跑了。本文用的数据来自kaggle,相信搞机器学习的同学们都知道它,kaggle上有几个老题目一直开放,适合给新手练级,上面还有很多老司机的方案共享以及讨论,非常方便新手入门。这次用的数据是Classify handwritten digits using the famous MNIST data—手写...转载 2018-04-11 20:32:30 · 211 阅读 · 0 评论 -
交叉验证及其用于参数选择、模型选择、特征选择的例子
【scikit-learn】交叉验证及其用于参数选择、模型选择、特征选择的例子原创 2016年01月22日 15:54:56标签:scikit-learn23515内容概要¶训练集/测试集分割用于模型验证的缺点K折交叉验证是如何克服之前的不足交叉验证如何用于选择调节参数、选择模型、选择特征改善交叉验证1. 模型验证回顾¶进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们...转载 2018-04-11 18:56:01 · 3377 阅读 · 0 评论 -
3.1.6 峰度(Kurtosis)和偏度(Skewness)
3.1.6 峰度(Kurtosis)和偏度(Skewness)《SPSS 17中文版统计分析典型实例精粹》以最新的SPSS 17中文版为写作对象,从实际应用的角度出发,通过大量实例,详细介绍了SPSS在调查统计、市场研究、数据分析和医学统计领域的应用方法与技巧。第3章是SPSS基础统计描述。本节说的是峰度(Kurtosis)和偏度(Skewness)。作者:赖国毅,陈超编著来源:电子工业出版社|2...翻译 2018-04-11 15:17:35 · 10010 阅读 · 0 评论 -
机器学习材料
优质平台1.https://github.com/wepe原创 2018-04-08 19:17:01 · 469 阅读 · 0 评论 -
拒绝日夜调参:超参数搜索算法一览
拒绝日夜调参:超参数搜索算法一览语言: CN / TW / HK时间 2018-10-31 15:22:57 机器之心主题 数据挖掘 数学机器学习训练模型的过程中自然少不了调参,许多机器学习工程师都戏称自己为「调参师」,其重要性不言而喻。模型的参数可分成两类:参数与超参数,前者是模型通过自身的训练学习得到的参数数据;后者则需要通过自身经验设置,以提高模型训练的效果。如下图中红色...转载 2018-12-07 15:37:32 · 6842 阅读 · 1 评论