
算法
B_H_L
这个作者很懒,什么都没留下…
展开
-
排序算法
下面这个网站是一个非常丰富的排序算法的网站。Sorting Algorithm Animationshttp://www.sorting-algorithms.com/这是一个非常不错的排序算法的网站,当你打开这个网站的时候,请不要因为看到很多个图片的大红叉而鄙视它。你先点击网页上方的Problem Size,选择一个尺寸,20,30,40还是50,都行,于是你就可以看到下面整转载 2012-09-26 10:21:00 · 1005 阅读 · 0 评论 -
搜狗笔试题——加密解密
public class Test { public static void encode(byte[] in, byte[] out, int password) { int len = in.length; //原理: a^b^b = a int seed = password ^ 0x8c357ca5; for (转载 2012-09-26 10:24:44 · 1391 阅读 · 0 评论 -
大数求和
我们现有的编程语言提供的数据类型都是有范围限制的。例如在C/C++语言,基于VC编译器,int类型是4个字节。表示数的有效范围是-2,147,483,648 到 2,147,483,647。所以如果要计算的很大的时候,例如要计算的数的位数是50位以上的。那么用编程语言提供的内部数据类型是不能进行运算的,因为数太大,存储不下。解决这种问题我们一般是借助字符数组进行存储。将大数的每一位看出是一转载 2012-09-26 10:08:28 · 2838 阅读 · 0 评论 -
一致性hash算法 - consistent hashing
一致性 hash 算法( consistent hashing )张亮consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在 cache 系统中应用越来越广泛;1 基本场景比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N转载 2013-10-15 11:15:28 · 932 阅读 · 0 评论 -
K-Means++算法
k-means算法是一种基本的聚类算法,这个算法的先决条件是 1)必须选择最终结果需要聚为几类,就是k的大小。 2)初始化聚类中心点,也就是seeds。 当然,我们可以在输入的数据集中随机的选择k个点作为seeds,但是随机选择初始seeds可能会造成聚类的结果和数据的实际分布相差很大。既然选择初始的seeds这么重要,那有什么算法可以帮助选择初始的seeds吗?当然转载 2013-10-15 16:30:37 · 13830 阅读 · 3 评论 -
K-Means 算法
最近在学习一些数据挖掘的算法,看到了这个算法,也许这个算法对你来说很简单,但对我来说,我是一个初学者,我在网上翻看了很多资料,发现中文社区没有把这个问题讲得很全面很清楚的文章,所以,把我的学习笔记记录下来,分享给大家。在数据挖掘中, k-Means 算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。问题转载 2013-10-15 16:31:22 · 1283 阅读 · 0 评论 -
字符串匹配算法(KMP)
1、BF算法BF算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配,若相等,则继续比较S的第二个字符和P的第二个字符;若不相等,则比较S的第二个字符和P的第一个字符,依次比较下去,直到得出最后的匹配结果。int BFMatch(char *s,char *p){ int i,j; i=0; while(i<strlen转载 2014-05-23 13:09:55 · 892 阅读 · 0 评论 -
基于统计的中文分词
分词方法 目前的分词方法归纳起来有3 类: 第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析, 利用句法信息和语义信息来进行词性标注, 以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂, 基于语法和规则的分词法所能达到的精确度远远还不能令人满意, 目前这种分词系统还处在试验阶段。 第二类是机械式分词法(即基于词典)。机械分词的原理是将文档转载 2014-05-26 17:33:17 · 2079 阅读 · 0 评论 -
字符串哈希函数
基本概念所谓完美哈希函数,就是指没有冲突的哈希函数,即对任意的 key1 != key2 有h(key1) != h(key2)。设定义域为X,值域为Y, n=|X|,m=|Y|,那么肯定有m>=n,如果对于不同的key1,key2属于X,有h(key1)!=h(key2),那么称h为完美哈希函数,当m=n时,h称为最小完美哈希函数(这个时候就是一一映射了)。在处理大规模字符串数据转载 2014-08-27 10:15:27 · 779 阅读 · 0 评论