
机器学习
文章平均质量分 77
白熊花田
这个作者很懒,什么都没留下…
展开
-
支持向量机
转载自:http://www.hankcs.com/ml/support-vector-machine.html 码农场 » 支持向量机本文是《统计学习方法》第七章《支持向量机》的笔记,附带了少量注解和背景知识的补充;后半部分将《机器学习实战》支持向量机的Python代码加以整理注释,与公式放到一起形成对照,辅助理解。私以为,没有泛函分析基础的人是无法深刻理解支持向量机的,更不能随转载 2016-03-30 08:32:54 · 9198 阅读 · 1 评论 -
推荐系统原理介绍
写在正文之前 最近在做推荐系统,在项目组内做了一个分享。今天有些时间,就将逻辑梳理一遍,将ppt内容用文字沉淀下来,便于接下来对推荐系统的进一步研究。推荐系统确实是极度复杂,要走的路还很长。 A First Glance 为什么需要推荐系统——信息过载 随着互联网行业的井喷式发展,获取信息的方式越来越多,人们从主转载 2016-05-02 10:10:06 · 1375 阅读 · 0 评论 -
推荐系统的学习笔记
一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《集体智慧编程》和《机器学习实战》)和自己网上搜的一些资料。而当被问及对推荐系统的改进和理解,发现自己对推荐系统所知甚少,除了知道几个常用的算法外,根本没有更深入的理解,更别提改进了。本篇博客为学习《推荐系统》一书的读书笔记,记录了常见的推荐算法和其思想。 ps:推荐系统入门学习可以看蒋凡先生翻译的《推荐系统》和项量的《推荐系原创 2016-05-02 10:10:32 · 6032 阅读 · 0 评论 -
Apriori算法实现
Apriori简介Apriori是挖掘关联规则的频繁项集算法。频繁项集(frequent item set):经常出现在一起的物品集合。关联规则(association rule):暗示两种物品之间可能存在很强的关系。支持度(support):交易包含X∪Y总交易量\frac{交易包含X\cup Y}{总交易量}置信度\可信度(confindence):交易包含X∪Y交易量包含X=X→Y\f原创 2016-09-02 11:33:18 · 2711 阅读 · 2 评论 -
使用sklearn进行增量学习
问题实际处理和解决机器学习问题过程中,我们会遇到一些“大数据”问题,比如有上百万条数据,上千上万维特征,此时数据存储已经达到10G这种级别。这种情况下,如果还是直接使用传统的方式肯定行不通,比如当你想把数据load到内存中转成numpy数组,你会发现要么创建不了那么大的numpy矩阵,要么直接加载时报MemeryError。 在这种情况下我了解了几种选择办法,1. 对数据进行降维,2. 使用流式或原创 2016-11-10 19:50:21 · 36401 阅读 · 12 评论 -
机器学习算法比较
本文转载自:http://www.csuldw.com/2016/02/26/2016-02-26-choosing-a-machine-learning-classifier/本文主要回顾下几个常用算法的适应场景及其优缺点!(提示:部分内容摘自网络)。机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启转载 2016-08-23 19:12:09 · 988 阅读 · 0 评论 -
对于PRC和ROC曲线衡量分类器效果的思考
我们在分类中往往采用一些指标如Precision,Recall,ROC图来衡量一个分类器的分类效果。在实际中遇到的数据往往是正负样本不平衡(class imbalance)的,比如假设100个人里面有1个是癌症患者,那么,分类器只要对所有样本返回非癌症即可获得99%的Accuracy,然而此时的分类器并没有意义,它不能识别任何的癌症患者。此时我们需要Precision,Recall,调原创 2016-07-23 20:24:25 · 5213 阅读 · 2 评论 -
Logistic回归总结
Logistic回归总结作者:洞庭之子微博:洞庭之子-Bing(2013年11月)PDF下载地址:http://download.youkuaiyun.com/detail/lewsn2008/65474631.引言看了Stanford的Andrew Ng老师的机器学习公开课中关于Logistic Regression的讲解,然后又看了《机器学习实战》中转载 2016-04-29 20:09:15 · 801 阅读 · 0 评论 -
从最大似然到EM算法浅解
从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什转载 2016-04-27 10:15:52 · 783 阅读 · 0 评论 -
协同过滤及其实践
主题我将在这篇文章中简单介绍一下协同过滤,介绍下协同过滤的定义,介绍基于物品和基于用户协同过滤的含义和区别,重点介绍一下基于物品协同过滤的共现矩阵实现方式。以此文记录下我学习协同过滤的的心得和实践感受,内容较为主观,有问题可以提出。协同过滤协同过滤推荐方法的主要思想是利用用户群过去的行为来预测当前用户可能喜欢哪些物品或者对哪些物品感兴趣。其包含两种协同过滤技术,一种是Memory Based的协同过原创 2016-12-12 14:36:54 · 4020 阅读 · 0 评论