
算法
文章平均质量分 70
woshichengchaoa
这个作者很懒,什么都没留下…
展开
-
求最大矩形面积
如图柱状图,求最大矩形面积。假设输入高度为2 1 4 5 1 3 3则最大矩形面积应该为4*2=8解题思路如下:设矩形为一个二元组(x,y),x为高度,y为宽,在栈内存储这些二元组高度为2元素进栈,栈内存储(2,1)高度为1元素进栈,从栈顶开始删除高度大于或等于1的二元组,因为其已经不可以继续向右延续了,同时用弹出二元组更新最大矩形面积为2*1=2,然后把它的宽度1累加到当前高原创 2013-04-07 23:17:30 · 1188 阅读 · 0 评论 -
SVM学习
SVM是一种基于统计学习理论的模式识别方法。目标:找到一个超平面,使得它能够尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分类面最远。解决方法:构造一个在约束条件下的优化问题,具体的说是一个受限二次规划问题(constrained quadratic programing),求解该问题,得到分类器。 在模式识别中,求解问题一般可以描述如下:已知:n个观原创 2013-04-10 16:19:25 · 1065 阅读 · 0 评论 -
AdaBoost(学习过程)
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使翻译 2013-04-09 23:22:51 · 746 阅读 · 0 评论 -
k-邻近算法
首先介绍最邻近算法 已知N个已知类别样本,计算待识别样本x与已知样本xi之间的距离,将它判为距离最近那个样本所属的类。 k-近邻算法: 已知N个已知类别样本,计算待识别样本x与已知样本xi之间的距离,取k个最近相邻样本,这k个样本属于哪个类最多,待识别样本就属于该类。 剪辑最近邻算法:第一步:k-NN进行样本剪辑第二部:1-NN进行样本分类原创 2013-04-12 21:35:21 · 1100 阅读 · 0 评论 -
常用排序算法
1、插入排序:假设数组A[0,...,n-1],A[0,...,p]按照从小到大的顺序排序完毕,将A[p+1,...,n-1]中元素一次与之前元素比较,并插入至相应位置,算法复杂度为n^2(符号省略,下同)void INSERT_SORT(int *A,int len){for(int i=1;i { int key=A[i]; int j=i-1;原创 2013-04-08 11:02:18 · 648 阅读 · 0 评论 -
海量数据面试题整理 分类: 面试珠玑
文件共同的url?方案1:可以估计每个文件的大小为5G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约为300M。s 遍历文件b,采取和a相同的方式将url分别存储到1000个小文件(记为)。这样处理后,所有可能相同转载 2014-03-27 18:01:03 · 668 阅读 · 0 评论 -
2012淘宝笔试及答案
请给位大牛给出参考答案一、单选题1、我们有很多瓶无色的液体,其中有一瓶是毒药,其它都是蒸馏水,实验的小白鼠喝了以后会在5分钟后死亡,而喝到蒸馏水的小白鼠则一切正常。现在有5只小白鼠,请问一下,我们用这五只小白鼠,5分钟的时间,能够检测多少瓶液体的成分()a 5瓶 b 6 c 31 d 322、若某链表最常用的操作是在最后一个结点之后插入一个结点和删除最后一个结点,则采用()存储原创 2014-04-06 21:16:46 · 1103 阅读 · 0 评论