
algorithm/job hunting
文章平均质量分 63
LifeFighter
上海市闵行区上海交通大学闵行校区
展开
-
UML
标准建模语言UML的重要内容可以由下列五类图(共10种图)来定义:第一类是用例图,从用户角度描述系统功能,并指出各功能的操作者。第二类是静态图 (Static diagram),包括类图、对象图和包图。类图描述系统中类的静态结构。不仅定义系统中的类,表示类之间的联系如关联、依赖、聚合等,也包括类的内部结构(类的属性和操作)。类图描述的是一种静态关系,在系统的整个生命周期原创 2013-06-16 11:26:09 · 681 阅读 · 0 评论 -
基于Hadoop的数据挖掘
数据挖掘主要由以下步骤组成:1.数据预处理数据预处理阶段主要为数据挖掘准备好数据。一般来讲主要包括数据清理和数据集成。对于大量的数据,难免存在噪声或不一致的数据。对于存在这些问题的数据源,我们必须进行数据预处理。数据挖掘面对的挖掘对象的种类越来越多(半结构数据、web数据、来自云的数据等各种数据形式层出不穷)。2.数据挖掘一旦对数据的预处理工作完成,数据挖掘工作就开转载 2013-07-02 19:01:39 · 4449 阅读 · 0 评论 -
数据挖掘十大经典算法
数据挖掘十大经典算法国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中转载 2013-07-02 19:16:14 · 3207 阅读 · 0 评论 -
程序员都应该知道的论文和文章
极客头条24每个程序员都应该知道的论文和文章文章由刘江总编于23小时前分享 评论(34) http://projectmona.com/bits-of-brilliance-session-five/里面内容很杂但很丰富,是UIUC教授Jeff Erickson在编程方面的个人收集(其他收集可以参见:http://projectmona.com/bits-of-brilliance/ 包括费曼、尼转载 2013-07-01 18:02:26 · 923 阅读 · 0 评论 -
BloomFilter——大规模数据处理利器
转载至http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html 非常感谢原作者奉献 Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。 一. 实例 为了说明Bl转载 2013-07-14 16:25:59 · 608 阅读 · 0 评论 -
布隆过滤器 (Bloom Filter) 详解
转载至Allen Sun http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html 非常感谢他的无私布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过转载 2013-07-14 16:24:19 · 1098 阅读 · 0 评论 -
常见的Hash算法
常见的Hash算法2011-04-08 22:31 1999人阅读 评论(6) 收藏 举报简介哈希方法学哈希函数和素数位偏向各种形式的哈希常用的哈希函数各版本哈希代码下载简介哈稀函数按照定义可以实现一个伪随机数生成器(PRNG),从这个角度可以得到一个公认的结论:哈希函数之间性能的比较可以通过比较其在伪随机生成方面的比较来衡量。一些常用的转载 2013-07-14 16:18:38 · 1052 阅读 · 0 评论 -
bloom filter 的Java 版
转载文章 感谢原作者的无私奉献一、 Bloom-Filter算法简介。 Bloom-Filter,即布隆过滤器,1970年由Bloom中提出。它可以用于检索一个元素是否在一个集合中,其优点是空间效率和查询时间都远远超过其他算法,其不足在于Bloom- Filter存在着误判。 二、 Bloom-Filter的基本思想。 Bloom-Filter转载 2013-07-14 16:29:08 · 830 阅读 · 0 评论 -
.双层桶划分
双层桶划分 ----其实本质上就是【分而治之】的思想,重在“分”的技巧上!适用范围:第k大,中位数,不重复或重复的数字 基本原理及要点:因为元素范围很大,不能利用直接寻址表,所以通过多次划分,逐步确定范围,然后最后在一个可以接受的范围内进行。可以通过多次缩小,双层只是一个例子。 扩展: 问题实例: 1).2.5亿个整数中找出不重复的整数的个数,内存空间不足以容纳转载 2013-06-28 19:50:44 · 984 阅读 · 0 评论 -
一致性 hash 算法( consistent hashing )
一致性 hash 算法( consistent hashing )张亮consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在 cache 系统中应用越来越广泛;1 基本场景比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N转载 2013-06-28 22:38:32 · 766 阅读 · 0 评论 -
SQL中JOIN和UNION区别、用法及示例介绍
1.JOIN和UNION区别 join 是两张表做交连后里面条件相同的部分记录产生一个记录集, union是产生的两个记录集(字段要一样的)并在一起,成为一个新的记录集 。 JOIN用于按照ON条件联接两个表,主要有四种: INNER JOIN:内部联接两个表中的记录,仅当至少有一个同属于两表的行符合联接条件时,内联接才返回行。我理解的是只要记录不符合ON条件,就不会显示在转载 2013-06-19 20:24:08 · 819 阅读 · 0 评论 -
OLTP和OLAP的区别
OLAP(联机分析处理)什么是联机分析处理(OLAP)联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction proces转载 2013-06-19 20:11:37 · 715 阅读 · 0 评论 -
字符串匹配算法总结
转自:http://blog.youkuaiyun.com/zdl1016/archive/2009/10/11/4654061.aspx 我想说一句“我日,我讨厌KMP!”。KMP虽然经典,但是理解起来极其复杂,好不容易理解好了,便起码来巨麻烦!老子就是今天图书馆在写了几个小时才勉强写了一个有bug的、效率不高的KMP,特别是计算next数组的部分。其实,比KMP算法速度快的转载 2013-07-03 19:03:23 · 949 阅读 · 0 评论