
机器学习实战
片刻小哥哥
世界很美 而你正好有空
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【机器学习实战】第15章 大数据与MapReduce
第15章 大数据与MapReduce大数据 概述大数据: 收集到的数据已经远远超出了我们的处理能力。大数据 场景假如你为一家网络购物商店工作,很多用户访问该网站,其中有些人会购买商品,有些人则随意浏览后就离开。对于你来说,可能很想识别那些有购物意愿的用户。那么问题就来了,数据集可能会非常大,在单机上训练要运行好几天。接下来:我们讲讲 MapRede原创 2017-10-09 10:54:19 · 2224 阅读 · 3 评论 -
【机器学习实战】第13章 利用 PCA 来简化数据
第13章 利用 PCA 来简化数据降维技术场景我们正通过电视观看体育比赛,在电视的显示器上有一个球。显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给出运动场上球的位置。在这个过程中,人们已经将百万像素点的数据,降至为三维。这个过程就称为降维(dimensionali原创 2017-09-19 10:31:02 · 1520 阅读 · 0 评论 -
【机器学习实战】第14章 利用SVD简化数据
第14章 利用SVD简化数据http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>SVD 概述奇异值分解(SVD, Singular Value Decomposition): 提取信息的一种方法,可以把 SVD 看成是从噪声数据中抽取相关特征。从生物信息学到金融学,SVD 是提取信息原创 2017-10-09 10:53:09 · 867 阅读 · 0 评论 -
【机器学习实战】第11章 使用 Apriori 算法进行关联分析
第 11 章 使用 Apriori 算法进行关联分析关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式:频繁项集(frequent item sets): 经常出现在一块的物品的集合。关联规则(associational rules): 暗示两种物品之间可能存在很强的关系。相关术语关联分析(关联规则学习): 从大规模数据集原创 2017-10-09 10:48:59 · 1069 阅读 · 0 评论 -
【机器学习实战】第12章 使用FP-growth算法来高效发现频繁项集
第12章 使用FP-growth算法来高效发现频繁项集前言在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则。本章将继续关注发现 频繁项集 这一任务,并使用 FP-growth 算法更有效的挖掘 频繁项集。FP-growth 算法简介一种非常好的发现频繁项集算法。基于Apriori算法构建,但是数据结构不同,使用叫做原创 2017-10-09 10:51:34 · 759 阅读 · 0 评论 -
【机器学习实战】第9章 树回归
第9章 树回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>树回归 概述我们本章介绍 CART(Classification And Regression Trees, 分类回归树) 的树构建算法。该算法既可以用于分类还可以用于回归。树回归 场景我们在第 8 章原创 2017-10-09 10:47:36 · 1309 阅读 · 0 评论 -
【机器学习实战】第10章 K-Means(K-均值)聚类算法
第 10章K-Means(K-均值)聚类算法K-Means 算法聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 个不同的簇, 且每个簇的中心采用簇中所含值的均值计算而成.簇个数 K原创 2017-09-19 10:27:01 · 1650 阅读 · 0 评论 -
【机器学习实战】第8章 预测数值型数据:回归
第8章 预测数值型数据:回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>回归(Regression) 概述我们前边提到的分类的目标变量是标称型数据,而回归则是对连续型的数据做出处理,回归的目的是预测数值型数据的目标值。回归 场景回归的目的是预测数值型的目标值。原创 2017-10-09 10:45:55 · 1380 阅读 · 0 评论 -
【机器学习实战】第7章 集成方法 ensemble method
第7章 集成方法 ensemble method集成方法: ensemble method(元算法: meta algorithm) 概述概念:是对其他算法进行组合的一种形式。通俗来说: 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。 机器学习处理问题时又何尝不是如此? 这就是集成方法背后的思想。集成方法:投票选举(bag原创 2017-08-25 18:49:24 · 1372 阅读 · 0 评论 -
【机器学习实战】第6章 支持向量机
第6章 支持向量机http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>支持向量机 概述支持向量机(Support Vector Machines, SVM):是一种机器学习算法。支持向量(Support Vector)就是离分隔超平面最近的那些点。机(Machine)就是表示一种原创 2017-04-24 17:56:45 · 2655 阅读 · 0 评论 -
【机器学习实战】第5章 Logistic回归
第5章 Logistic回归http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>Logistic 回归 概述Logistic 回归虽然名字叫回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线建立回归公式,以此进行分类。须知概念Sigmoid 函数回归原创 2017-10-09 10:41:25 · 882 阅读 · 0 评论 -
【机器学习实战】第4章 基于概率论的分类方法:朴素贝叶斯
第4章 基于概率论的分类方法:朴素贝叶斯http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>朴素贝叶斯 概述贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种原创 2017-09-03 23:47:33 · 931 阅读 · 0 评论 -
【机器学习实战】第3章 决策树
第3章 决策树http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>决策树 概述决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。决策树 场景一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物原创 2017-09-01 10:58:58 · 1529 阅读 · 0 评论 -
【机器学习实战】第2章 K-近邻算法(k-NearestNeighbor,KNN)
第2章 k-近邻算法http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default">>KNN 概述k-近邻(kNN, k-NearestNeighbor)算法主要是用来进行分类的.KNN 场景电影可以按照题材分类,那么如何区分 动作片 和 爱情片 呢?动作片:打斗次数更原创 2017-04-24 22:54:44 · 2705 阅读 · 0 评论 -
【机器学习实战】第1章 机器学习基础
第1章 机器学习基础机器学习 概述机器学习就是把无序的数据转换成有用的信息。获取海量的数据从海量数据中获取有用的信息我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义。机器学习 场景例如:识别动物猫模式识别(官方标准):人们通过大量的经验,得到结论,从而判断它就是猫。机器学习(数据学习):人们通过阅读进行学习,观察它会叫、小眼睛、两只耳朵、四条腿、一条尾巴,得到结论,从而判断它就是原创 2017-04-24 17:54:00 · 1627 阅读 · 0 评论 -
【机器学习实战】Machine Learning in Action 代码 视频 项目案例
MachineLearning欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远ApacheCN - 学习机器学习群【629470233】Machine Learning in Action (机器学习实战) | ApacheCN(apache中文网)电子版书籍:【机器学习实战-中文版-带目录版.pdf】视频每周更新:如果你觉得有价值,请帮忙点 Star【后续组原创 2017-06-12 19:03:19 · 5283 阅读 · 2 评论