
机器学习实战笔记
机器学习是人工智能研究领域中一个极其重要的研究方向,在当前的大数据时代背景下,捕获数据并从中获取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,机器学习算法也成为数据分析的重要技术方法。
zhihua_bupt
极客码农,Coding the life,Coding the world!!!
展开
-
"阿里巴巴"杯北邮数据挖掘竞赛(一)
一、赛题介绍在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是联接消费者与商品最重要的纽带。 本届赛题的任务就是根据用户近200天在天猫的行为日志,建立用户的品牌偏好,并对用户的性别和年龄进行分类。 根据性别和年龄将用户分为了12类,建议参赛者考虑类别不平衡问题(偏斜不严重)。比赛共约700MB的数据量,按6:2:2的比例分配与训练集、测试集1、测试集2。原创 2016-03-04 16:58:58 · 2971 阅读 · 1 评论 -
卷积神经网络Lenet-5实现
原文地址:http://blog.youkuaiyun.com/hjimce/article/details/47323463作者:hjimce卷积神经网络算法是n年前就有的算法,只是近年来因为深度学习相关算法为多层网络的训练提供了新方法,然后现在电脑的计算能力已非当年的那种计算水平,同时现在的训练数据很多,于是神经网络的相关算法又重新火了起来,因此卷积神经网络就又活了起来,再开始前,我们需要转载 2016-01-29 10:16:15 · 37944 阅读 · 6 评论 -
深度学习——机器学习的新浪潮
注明:转载自博客http://blog.youkuaiyun.com/datoubo/article/details/8577366转载 2016-01-27 16:41:00 · 2075 阅读 · 2 评论 -
基于深度学习的图像去噪(论文总结)
2015深度学习、自编码器、低照度图像增强Lore, Kin Gwn, Adedotun Akintayo, and Soumik Sarkar. "LLNet: A Deep Autoencoder Approach to Natural Low-light Image Enhancement." arXiv preprint arXiv:1511.03995 (2015).利用深度原创 2016-01-24 00:24:47 · 29993 阅读 · 1 评论 -
机器学习实战笔记——微软小冰的读心术与决策树
最近微信朋友圈很多人在转发的一个游戏叫做“微软小冰读心术”,游戏的规则很简单:参与游戏的一方在脑海里想好一个人的名字,然后微软小冰会问你15个问题,问题的答案只能用“是”、“不是”或者“不知道”回答。微软小冰通过你的回答进行推断分解,逐步缩小待猜测人名的范围,决策树的工作原理与这些问题类似,用户输入一系列数据,然后会给出游戏的答案。一、决策树原创 2016-01-23 22:39:00 · 12031 阅读 · 0 评论 -
机器学习实战笔记——基于KNN算法的手写识别系统
利用k-近邻分类器实现手写识别系统,训练数据集大约2000个样本,每个数字大约有200个样本,每个样本保存在一个txt文件中,手写体图像本身是32X32的二值图像,如下图所示:首先,我们需要将图像格式化处理为一个向量,把一个32X32的二进制图像矩阵通过img2vector()函数转换为1X1024的向量:def img2vector(filename): retu原创 2016-01-17 14:16:50 · 4706 阅读 · 2 评论 -
机器学习实战笔记——利用KNN算法改进约会网站的配对效果
一、案例背景我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现曾交往过三种类型的人:(1)不喜欢的人;(2)魅力一般的人;(3)极具魅力的人;尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类,她觉得可以在周一到周五约会那些魅力一般的人,而周末则更喜欢与那些极具魅力的人为伴原创 2016-01-17 12:57:55 · 6853 阅读 · 4 评论 -
机器学习实战笔记——KNN算法
一、KNN算法描述KNN(K-nearest neighbor algorithm),也就是K近邻算法,顾名思义,可以形象的理解为求K个最近的邻居。当K=1时,KNN算法就成了最近邻算法,即寻找最近的那个邻居。所谓K近邻算法,就是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(就是上面提到的K个邻居),如果这K个实例的多数属于某个类,就将该输入实例分类到这个原创 2016-01-15 10:01:20 · 3488 阅读 · 0 评论 -
机器学习实战笔记——基于SVD的图像压缩
原始图像大小为32 X 32=1024像素,利用SVD来对数据降维,实现图像的压缩新建一个svdRec.py文件,加入如下代码:#printMat()函数用于打印矩阵 def printMat(inMat, thresh=0.8): for i in range(32): for k in range(32): if fl原创 2016-01-11 17:32:07 · 5833 阅读 · 3 评论 -
机器学习实战笔记——利用SVD简化数据
SVD(Singular Value Decomposition)奇异值分解,可以用来简化数据,去除噪声,提高算法的结果。一、SVD与推荐系统下图由餐馆的菜和品菜师对这些菜的意见组成,品菜师可以采用1到5之间的任意一个整数来对菜评级,如果品菜师没有尝过某道菜,则评级为0建立一个新文件svdRec.py并加入如下代码:def loadExData(): return[原创 2016-01-11 11:07:53 · 5373 阅读 · 8 评论