
机器学习
文章平均质量分 71
代码裤
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习十大算法之k-最近邻算法
机器学习是大数据应用发展最快的一个领域,同时也是支撑着人工智能领域的脊柱。机器学习是模拟人的学习方式,即经验学习,让计算机自己具有一定的学习能力,能够从已经存在的数据集中总结出一些模型,以此模型来解决现实存在的某些问题。机器学习的特点就是‘智能’,因为计算机可以根据训练数据集自动地改进模型的预测效果和性能,从而使得计算机具有了自己‘学习’,提升‘自己’的能力。 k-最邻近算法是机原创 2015-08-26 18:52:45 · 1964 阅读 · 0 评论 -
logistic回归
初步接触谓LR分类器(Logistic Regression Classifier),并没有什么神秘的。在分类的情形下,经过学习之后的LR分类器其实就是一组权值w0,w1,...,wm. 当测试样本集中的测试数据来到时,这一组权值按照与测试数据线性加和的方式,求出一个z值:z = w0+w1*x1+w2*x2+...+wm*xm。 ① (其中x1,x2,...,xm是某样本数据转载 2015-08-27 20:36:46 · 2027 阅读 · 0 评论 -
mahout如何使用随机森林测试数据集
最近在研究机器学习经典的分类算法随机森林,需要用随机森林算法来测试一个小的数据集。开源项目mahout实现了大多数经典的机器学习算法,里面也提供了很多处理数据,提取特征,训练算法模型的类和方法,但是貌似国内用这个开源项目的人并不多,因为网上关于具体如何使用mahout算法的资料廖若晨星,而mahout实战中也没有关于随机森林的使用例子,这部分信息只能从mahout官网中搜集到,而mahout官网中原创 2016-04-18 00:10:42 · 4618 阅读 · 0 评论