
算法用的基础知识
文章平均质量分 81
lile269
这个作者很懒,什么都没留下…
展开
-
后缀数组
<br />在字符串处理当中,后缀树和后缀数组都是非常有力的工具,其中后缀树大家了解得比较多,关于后缀数组则很少见于国内的资料。其实后缀数组是后缀树的一个非常精巧的替代品,它比后缀树容易编程实现,能够实现后缀树的很多功能而时间复杂度也不太逊色,并且,它比后缀树所占用的空间小很多。可以说,在信息学竞赛中后缀数组比后缀树要更为实用。因此在本文中笔者想介绍一下后缀数组的基本概念、构造方法,以及配合后缀数组的最长公共前缀数组的构造方法,最后结合一些例子谈谈后缀数组的应用。 基本定义子串<br /> 字符串 S 的转载 2011-05-24 17:12:00 · 1005 阅读 · 0 评论 -
海量数据处理利器 STL中哈希表 hash_map(C++)
对海量数据进行处理的时候经常要使用hash_map,java里使用hash_map比较简单,下面将介绍C++ STL中哈希表 hash_map的使用方法,主要内容引用下面链接内容。http://blogold.chinaunix.net/u2/82382/showart.php?id=20729590 为什么需要hash_map用过map吧?map提供一个很常用的功能,那就是提供key-value的存储和查找功能。例如,我要记录一个人名和相应的存储,而且随时增加,要快速查找和修改:岳不群-华山派掌门人,人称转载 2011-05-01 00:17:00 · 2529 阅读 · 0 评论 -
URL短地址压缩算法 微博短地址原理解析
引自 http://www.nowamagic.net/webdesign/webdesign_ShortUrlInTwitter.php短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新郎的sinaurl.cn等。我们在QQ微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://url.cn/2hytQx为什么要这样做的,原因我想有这样几点:微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯转载 2011-05-01 01:38:00 · 26491 阅读 · 3 评论 -
海量数据处理系列——BloomFilter
<br />引自http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html<br />Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。<br /> <br />一. 实例 <br /> 为了说明Bloom Filter存在的重要意义,举一个实例:<br /> 假设要你写一个网络蜘蛛(web crawler)。由于网络间转载 2011-05-02 16:16:00 · 1360 阅读 · 0 评论 -
海量数据处理系列——十道海量数据处理面试题与十个方法大总结
<br /> 海量数据处理:十道面试题与十个海量数据处理方法总结<br /><br />作者:July、youwang、yanxionglu。<br />时间:二零一一年三月二十六日<br />说明:本文分为俩部分,第一部分为10道海量数据处理的面试题,第二部分为10个海量数据处理的方法总结。有任何问题,欢迎交流、指正。<br />出处:http://blog.youkuaiyun.com/v_JULY_v。<br />--------------------------------------转载 2011-05-02 16:33:00 · 1787 阅读 · 5 评论 -
海量数据处理系列——C语言下实现bitmap算法
<br />bitmap是一个十分有用的结构。所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。 <br />如果说了这么多还没明白什么是Bit-map,那么我们来看一个具体的例子,假设我们要对0-7内的5个元素(4,7,2,5,3)排序(这里假设这些元素没有重复)。那么我们就可以采用Bit-map的方法来达到排序的目的。要表示8个数,我们就只需要8个Bit(1Bytes),首先我们开辟1Byte转载 2011-05-02 13:19:00 · 6946 阅读 · 6 评论