
algorithm
文章平均质量分 79
wangrunjie1986
这个作者很懒,什么都没留下…
展开
-
如何选择机器学习分类器?
如何选择机器学习分类器? 你知道如何为你的分类问题选择合适的机器学习算法吗?当然,如果你真正关心准确率,那么最佳方法是测试各种不同的算法(同时还要确保对每个算法测试不同参数),然后通过交叉验证选择最好的一个。但是,如果你只是为你的问题寻找一个“足够好”的算法,或者一个起点,这里有一些我这些年发现的还不错的一般准则。你的训练集有多大?如果训练集很小,那么高偏差/低方转载 2015-09-30 11:27:55 · 523 阅读 · 0 评论 -
数据挖掘工程师笔试及答案整理
2013百度校园招聘数据挖掘工程师一、简答题(30分)1、简述数据库操作的步骤(10分)步骤:建立数据库连接、打开数据库连接、建立数据库命令、运行数据库命令、保存数据库命令、关闭数据库连接。经萍萍提醒,了解到应该把preparedStatement预处理也考虑在数据库的操作步骤中。此外,对实时性要求不强时,可以使用数据库缓存。2、TCP/IP的四层结构(10转载 2014-09-26 16:11:35 · 940 阅读 · 0 评论 -
逻辑回归(logistic regression)
logistic regression可以解决分类问题,即输出的结果只有0和1两种,比如,对于邮件的判断只有是或者否。这种分类问题使用传统的线性回归并不能很好的解决。一个小例子例如,当我们根据肿瘤的大小判断一个肿瘤是不是良性的时候,输出结果只有是或者否,用1和0表示,给定的样本点,并且我们使用传统的线性回归问题解决拟合的函数图像如下: 图像中我们可以根据拟合曲线,转载 2014-09-10 16:29:56 · 751 阅读 · 0 评论 -
MPI 环境搭建
搭建目的为解决lda单机运行瓶颈,而plda的并行架构基于MPI。MPI install目标机器:10.210.228.63 10.210.228.64 10.210.228.65安装步骤:Download mpich2-1.0.8.tar.gz from http://www.mpich.org/static/downloads/1.0.8/mkdir -p /d原创 2014-05-05 18:40:17 · 935 阅读 · 0 评论 -
从item-base到svd再到rbm,多种Collaborative Filtering(协同过滤算法)从原理到实现
〇.说明 本文的所有代码均可在 DML 找到,欢迎点星星。一.引入 推荐系统(主要是CF)是我在参加百度的电影推荐算法比赛的时候才临时学的,虽然没拿什么奖,但是知识却是到手了,一直想写一篇关于推荐系统的文章总结下,这次借着完善DML写一下,权当是总结了。不过真正的推荐系统当然不会这么简单,往往是很多算法交错在一起,本文只是入门水平的总结罢了转载 2014-04-17 13:53:36 · 884 阅读 · 0 评论 -
三次指数平滑法(Holt-Winters)
在时间序列中,我们需要基于该时间序列当前已有的数据来预测其在之后的走势,三次指数平滑(Triple/Three Order Exponential Smoothing,Holt-Winters)算法可以很好的进行时间序列的预测。 时间序列数据一般有以下几种特点:1.趋势(Trend) 2. 季节性(Seasonality)。 趋势描述的是时间序列的整体走势,比如总体上升或者总转载 2014-04-16 14:06:20 · 7039 阅读 · 0 评论 -
Learning to Rank 简介
去年实习时,因为项目需要,接触了一下Learning to Rank(以下简称L2R),感觉很有意思,也有很大的应用价值。L2R将机器学习的技术很好的应用到了排序中,并提出了一些新的理论和算法,不仅有效地解决了排序的问题,其中一些算法(比如LambdaRank)的思想非常新颖,可以在其他领域中进行借鉴。鉴于排序在许多领域中的核心地位,L2R可以被广泛的应用在信息(文档)检索,协同过滤等领域。转载 2014-04-16 13:57:54 · 1268 阅读 · 0 评论 -
kd tree
kd树的应用很广,在图像特征匹配方面,也就是最终应用到图像设别,图像检索方面。对于地图的应用,像附近点搜索功能,对于三维当中的,碰撞检测,光线跟踪等等。总的来说呢,kd树就是一个搜索策略。kd树搜索什么呢,首先介绍一下kd树Kd-树是K-dimension tree的缩写,是对数据点在k维空间(如二维(x,y),三维(x,y,z),k维(x1,x2,x3..))中划分的一种数据结构,主转载 2013-11-28 13:04:56 · 1290 阅读 · 1 评论 -
求逆序对数
设A[1..n]是一个包含N个非负整数的数组。如果在i〈 j的情况下,有A〉A[j],则(i,j)就称为A中的一个逆序对。例如,数组(3,1,4,5,2)的“逆序对”有,,共4个。使用归并排序可以用O(nlogn)的时间解决统计逆序对个数的问题 定义:对于一个给定的数列,如果有iAj,则称(i,j)为一逆序对. 要解决的问题是,给出一个数列,求出这个数列包含多少个逆序对今天转载 2012-12-12 14:49:38 · 354 阅读 · 0 评论