
Machine Learning
文章平均质量分 90
XiaoGuang-Xu
主要从事Hadoop Spark Flink,兴趣爱好:数据挖掘和机器学方向
展开
-
机器学习 与 推荐算法
推荐系统的常用算法概述 前一阵子准备毕业论文的开题,一直在看推荐系统相关的论文。对推荐系统有了一个更加清晰和理性的认识,也对推荐算法有了深入了解。借此机会总结分享一下,大家多多拍砖。推荐系统的出现 随着互联网的发展,人们正处于一个信息爆炸的时代。相比于过去的信息匮乏,面对现阶段海量的信息数据,对信息的筛选和过滤成为了衡量一个系统好坏的重要指标。一个具有良好用户体验的系统,会转载 2014-11-12 14:46:56 · 758 阅读 · 0 评论 -
初识交替最小二乘ALS
初识交替最小二乘ALS ALS是alternating least squares的缩写 , 意为交替最小二乘法;而ALS-WR是alternating-least-squares with weighted-λ -regularization的缩写,意为加权正则化交替最小二乘法。该方法常用于基于矩阵分解的推荐系统中。例如:将用户(user)对商品(item)的评分矩阵分转载 2016-11-14 18:35:05 · 634 阅读 · 0 评论 -
浅谈矩阵分解在推荐系统中的应用
浅谈矩阵分解在推荐系统中的应用原文URL: http://blog.youkuaiyun.com/sun_168/article/details/20637833 推荐系统是当下越来越热的一个研究问题,无论在学术界还是在工业界都有很多优秀的人才参与其中。近几年举办的推荐系统比赛更是一次又一次地把推荐系统的研究推向了高潮,比如几年前的Neflix百万大奖赛,KDD CUP 2011的音乐推荐比转载 2016-11-14 18:11:22 · 564 阅读 · 0 评论 -
台大林轩田《机器学习基石》学习笔记7:线性模型三(Multiclass Prediction)
线性模型 - Linear modelsMulticlassPrediction 多级预测 做选择题(常用来解决辨识问题),用已有的是非题的解法去解决,两个思路: (1)OVA(One-Versus-All),先尝试用二元分类将每一个“某类”和其他类分开,把所有分类结果合成起来combine binary classifiers,则会出现转载 2016-10-17 23:49:09 · 399 阅读 · 0 评论 -
台大林轩田《机器学习基石》学习笔记6:线性模型二(Logistics regression)
原文地址:http://blog.youkuaiyun.com/qq_22717679/article/details/51178993线性模型 - Linear modelsLogisticsregression 逻辑回归 二值分类用分段函数将score映射到+1或-1,逻辑回归则是用Logistic函数将score映射到[0,1],因此也说逻辑回归是soft的转载 2016-10-17 23:44:31 · 396 阅读 · 0 评论 -
台大林轩田《机器学习基石》学习笔记5:线性模型一(PLA/pocket、Linearregression )
原文地址: http://blog.youkuaiyun.com/qq_22717679/article/details/51178927线性模型 - Linear models 举个例子引入,银行发放信用卡问题。银行掌握了某顾客的资料,包括年龄、性别、年薪、年工作时间、信用贷款等等,现在银行需要知道: 要不要发信用卡给该顾客?——Bin转载 2016-10-17 23:41:57 · 510 阅读 · 0 评论 -
台大林轩田机器学习课程笔记4----训练 VS. 测试
原文地址 : http://blog.youkuaiyun.com/steveyinger/article/details/51226787引言上一篇讲到了在有限的hypotheses下,学习错误的发生率,即E_in与E_out不同的概率边界,本篇将会探讨在infinite hypotheses情况下的概率边界。线的有效数字(Effective Number of Li转载 2016-10-17 23:14:54 · 453 阅读 · 0 评论 -
台大林轩田机器学习课程笔记1----机器学习初探及PLA算法
原文地址: http://blog.youkuaiyun.com/steveyinger/article/details/51111722目录(?)[+]机器学习初探1、什么是机器学习 学习指的是一个人在观察事物的过程中所提炼出的技能,相比于学习,机器学习指的就是让计算机在一堆数据中通过观察获得某些经验(即数学模型),从而提升某些方面(例如推荐系统的精度)的转载 2016-10-17 23:04:42 · 660 阅读 · 0 评论 -
台大林轩田机器学习课程笔记3----机器学习的可行性
原文地址: http://blog.youkuaiyun.com/steveyinger/article/details/51171828引例先引入一个矛盾问题: 图3.1 图案学习问题这是一道推理题,根据第一行和第二行图形的规律分别输出-1和+1,然后通过上述规则学习推理出第三行图形的输出。每个人通过学习所获得的答案是会不一致的,例如通过对称的规律可以得到第三行转载 2016-10-17 23:11:59 · 435 阅读 · 0 评论 -
台大林轩田机器学习课程笔记2----机器学习的分类
原文地址:http://blog.youkuaiyun.com/steveyinger/article/details/51115731 1. 根据输出集合二分类 根据输出空间,二分类的输出结果只有两种,即y={-1,1},具体的应用包括: *信用卡申请问题:Client Data=>Accept or Deny 邮件分类问题:Email Text=>Rubbish o转载 2016-10-17 23:07:32 · 276 阅读 · 0 评论 -
机器学习相关——协同过滤
机器学习相关——协同过滤在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知转载 2015-01-16 10:25:32 · 613 阅读 · 0 评论 -
机器学习算法工程师需要掌握的技能
机器学习算法工程师需要掌握的技能实话实说,目前大部分人上各种班来学习机器学习,学习大数据,归根到底还是希望能找到一个好的工作,拿到更高的薪水,当然还有一部分原因是自己对这一方面比较感兴趣,希望更深入的了解这个领域。我个人觉得,第一个原因的因素更大。首先,我们看看一个机器学习的系统长成什么样子几乎所有的机器学习系统都是由上述系转载 2017-05-27 23:29:25 · 1788 阅读 · 0 评论