
机器学习
拉克因
互联网打工人
展开
-
机器学习作业1 - 对率回归(逻辑回归)
使用10折交叉验证法和留一法评测对率回归分类器标题有点长哈……这是第一次作业,来自周志华《机器学习》作业3.4,题目如下: 选择两个UCI数据集,比较10折交叉验证法和留一法所估计出的对率回归(逻辑回归)的错误率。原创 2017-09-28 21:06:15 · 6787 阅读 · 0 评论 -
Mtcnn人脸检测实践
放寒假了,闲来无事就开始捣鼓人脸识别了。这次看了一篇2016年的论文,算是比较新的了。论文提到一种名为“基于多任务级联卷积神经网络进行人脸检测和对齐”的算法,英文名 Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks,简称MtCNN。论文地址如下:MTCNN_face_detec...原创 2018-02-21 22:21:37 · 9354 阅读 · 5 评论 -
机器学习作业6 - EM算法和朴素贝叶斯
EM算法和朴素贝叶斯上节课老师讲解了EM算法,然后要求我们使用EM算法完成一个低配版的朴素贝叶斯分类器。说实话网上的EM算法介绍的都比较抽象,对于数学并不是很好的我来说,看起来遇到了很大的障碍。对于EM算法的详细介绍可以参考 emma_zhang 的博文 机器学习之EM算法,下面我简单讲一下自己对于朴素贝叶斯分类器中EM算法的理解。原创 2017-11-28 13:58:42 · 4543 阅读 · 0 评论 -
机器学习作业8 - AdaBoost
AdaBoostUmm…这次作业写了很长时间,走了不少弯路,其实算法难度并不大,但是我一开始数据集选的比较奇葩,所以效果一直非常差,在50%左右徘徊,真是十分的绝望呀……后来换了个数据集,效果稍微好了点,超过了75%,还算能看吧。原创 2017-12-04 00:14:18 · 1028 阅读 · 0 评论 -
机器学习作业7 - 随机森林
随机森林首先吐槽下,这个星期作业实在是太多了……一周两个机器学习项目实在伤不起啊!!!所以这一次的随机森林我决定放点水,决策树部分就不自己写了,还是调库吧……当然随机森林部分还是得自己写的。事实上,如果决策树部分直接调库的话,随机森林可能是实现起来最简单的机器学习算法了原创 2017-12-02 11:23:28 · 976 阅读 · 0 评论 -
机器学习作业9 - 自动确定k值的k均值聚类
自动确定k值的k均值聚类说实话刚刚看到这个作业我是懵逼的。k均值本身不难,可是要自动确定k值,我就不知所措了。于是脑补了无数种方法,最后决定求助度娘。研究了几个小时以后,渐渐有了思路,于是一步步展开,写一下自己的想法吧。原创 2017-12-08 22:36:40 · 3835 阅读 · 2 评论 -
机器学习作业5 - 使用SkLearn中的SVM进行学习
使用SkLearn中的SVM进行学习这次的作业还是很简单的。可能是由于SVM实现起来难度太大吧,老师就不要求我们实现了,直接用库就好啦!这酸爽~原创 2017-10-24 21:11:11 · 899 阅读 · 0 评论 -
机器学习作业3 - 中心化的作用
中心化的作用这次作业是周志华《机器学习》中习题10.3,比较简单,就是一道问答题:在对高维数据进行降维的时候,为什么往往需要中心化呢?当然这个问题随便百度一下就一大堆答案啦,在这里放上我的理解,如有不对之处,还请指教。原创 2017-10-12 19:51:06 · 3631 阅读 · 1 评论 -
机器学习作业4 - 决策树和剪枝
决策树和两种剪枝方式(预剪枝和后剪枝)首先吐槽一下本次作业的残暴!手写决策树也就算了,还要剪枝!还要两种剪枝方式!!!写的我手残眼花,不过还好,勉强达到了题目要求。不过可以说明的是,我的代码肯定有需要改进的地方,甚至可能存在Bug,所以大家如果在看的时候发现任何问题,都可以通过评论或者私信指出,在这里谢谢大家了!原创 2017-10-19 10:20:05 · 3535 阅读 · 3 评论 -
机器学习作业2 - MDS和ISOMAP降维
MDS和ISOMAP降维本作业使用MDS和ISOMAP两种降维算法,对耶鲁大学人脸数据集进行降维,然后使用作业1中的对率回归(逻辑回归)分类器进行训练。原创 2017-09-28 21:46:54 · 5203 阅读 · 2 评论 -
自编码器简介
作用AutoEncoder,中文译名自编码器。主要用于特征提取,可以理解为一种基于神经网络的压缩、降维算法,和PCA等类似。自编码器为一种有损压缩算法,通过压缩(编码)获得数据等抽象特征,并可以通过解压缩(解码),将抽象特征尽可能地还原成原始数据。 因此,根据原PPT中对自编码器“学习用户高度抽象的特征”这一描述,可以推测出在模型任务中,主要使用自编码器对数据进行特征提取。网络结构...原创 2018-07-18 12:56:09 · 2108 阅读 · 1 评论