- 博客(6)
- 收藏
- 关注
原创 逻辑斯蒂回归与最大熵模型
逻辑斯蒂回归是经典的分类方法,最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型。这两个模型都属于对数线性模型逻辑斯蒂回归模型:分布函数图像是一条S曲线,值域的范围在0~1,采用极大似然估计法估计模型参数,首先确定其似然函数,然后再对似然函数取对数,求该似然函数的最大值,得到w的估计值最大熵原理:最大熵原理表述为在满足约束条件下模型集合中选择熵最大的模型 H(P)= -∑P(x)lo...
2018-05-22 21:42:47
499
原创 Hadoop权威指南——HDFS笔记
HDFS:Hadoop Distributed FileSystemHDFS以流式数据访问模式来存储超大文件,运用于商用硬件集群上。HDFS不支持多次写入。数据块:首先确定一点,磁盘以数据块的大小进行数据的读/写操作,构建于磁盘之上的文件系统通过磁盘块来管理文件系统中的块,文件系统块的大小通常为磁盘块的好几倍。HDFS中也存在块的概念,默认为64MB,与其他文件系统不同的是,如果一个文件小于块的大...
2018-05-21 18:07:51
199
原创 VirtualBox+Ubuntu16.04.4+Hadoop-2.6.5搭建
搭建这个环境真的是一把辛酸泪,不说了。赶紧记一下遇到的坑,防止之后再落入。前提:搭环境之前一定要先去了解一下hadoop大致的工作原理,懂得它的一些专业名词,比如JobTracker,TaskTracker,DataNode,NameNode等等,以及他们的作用,只有这样才不会一头雾水,我就是一开始就直接搭环境,一脸懵逼,最后只只能去恶补原理。我是用完全分布的方式来搭建hadoop的环境1.环境:...
2018-05-15 15:33:57
455
原创 关于预测与放置算法
Code Craft告一段落,前前后后忙活了一个多月,最终以武长赛区27名告终。其实,事先没有想到自己可以进入复赛,因为初赛的成绩并不理想,从来没有上过80分,也不知道是不是老天爷眷顾,初赛提交成绩居然破天荒的好,所以顺利进入复赛。非常非常感谢队友浩浩,不嫌弃不放弃,带着小白我打比赛。帮我解决各种疑难杂症。这次的题目大概分为两个部分,一部分为虚拟机的预测,另一部分是虚拟机的放置,初赛以预测为主,因...
2018-05-01 20:19:25
714
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人