
others essays
文章平均质量分 78
ustcqi
这个作者很懒,什么都没留下…
展开
-
大数据量处理方法总结
大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优. 1.Bloom filter 适用转载 2013-01-05 21:49:18 · 1254 阅读 · 0 评论 -
Bloom Filter概念和原理
Bloom Filter概念和原理焦萌 2007年1月27日 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter转载 2013-01-17 10:53:49 · 544 阅读 · 0 评论 -
CS牛人面经
本文涉及的内容更多地适用于在美国本土的技术面试。美国的面试更加正式规范,国内同学可做适当参考。面试的成功 = 60%的平时积累 + 30%的考前准备 + 10%的其他因素(如自信、谈吐)。所以,面试的准备对于我们这类凡人来说,异常重要;靠平时积累就能虐了面试官的大牛,不在本文考虑之列。下面将分Behavior Question和Technical Question分别介转载 2013-01-05 21:06:24 · 1131 阅读 · 0 评论 -
系统设计题浅谈
(1) 要求设计一个DNS的Cache结构,要求能够满足每秒5000以上的查询,满足IP数据的快速插入,查询的速度要快。(题目还给出了一系列的数据,比如:站点数总共为5000万,IP地址有1000万,等等)(2) 有N台机器,M个文件,文件可以以任意方式存放到任意机器上,文件可任意分割成若干块。假设这N台机器的宕机率小于1/3,想在宕机时可以从其他未宕机的机器中完整导出这M个文件,求最好的存放转载 2013-01-10 16:34:04 · 734 阅读 · 0 评论 -
维基百科中动态规划的部分讲解
Dynamic programming in computer programmingThere are two key attributes that a problem must have in order for dynamic programming to be applicable: optimal substructure and overlapping subpr转载 2013-01-06 21:35:11 · 954 阅读 · 0 评论 -
平摊分析
平摊分析 首先解释一下平摊分析的目的,之所以会有平摊分析是因为在很多算法或数据结构操作中我们直观的或用一般的方法计算出来的时间上界不够紧凑(也就是估大了),这是因为在一系列的数据结构操作中,有的操作消耗时间大有的消耗时间小,因此提出平摊分析技术计算所有数据结构操作后的平均时间代价以提高算法时间复杂度的紧凑度.另一方面,由于估计算法时间复杂度我们都要估计一个上界,因此无论是一般的方法还是利用平摊转载 2013-01-06 20:36:07 · 2955 阅读 · 1 评论 -
关于指针
指针就是指向一个特定内存地址的一个变量。简单的说可以理解为一个一维的线性空间,其中的每一个数对应一个存储单元,就是1个字节。指针有两个性质:指向性和偏移性。指向性指的是指针一定要有一个确定的指向,偏移性就是说指针可以加上一个数后偏移位置!指向别的存储空间。 指针的应用往往体现在数组,我们从数组开始解释指针的偏移。数组就是许多的变量,它的一个重要特征就是在内存空间中连续地存转载 2013-01-05 23:22:36 · 933 阅读 · 0 评论 -
教你如何迅速秒杀掉99%的海量数据处理面试题
教你如何迅速秒杀掉:99%的海量数据处理面试题作者:July出处:结构之法算法之道blog前言 一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,同时,此文可以看做是对这篇文章:十道海量数据处理面试题与十个方法大总结的一般抽象性总结。转载 2013-01-06 11:21:17 · 854 阅读 · 0 评论 -
IT男改变生活之12306选择上,中,下铺
我不得不说,IT男改变了生活.前提:使用除IE以外的任意浏览器第一步:进入预定界面,如下图: 第二步:鼠标放在硬卧(或软卧)上,单击鼠标右键,在下拉菜单中选择审查元素,然后会出现如下界面: 第三步:把鼠标定位到现在默认选中的代码的下一行,我们要选中的这一行的代码是:随机上铺中铺下铺第四步:右击鼠标,选择edit转载 2013-01-06 12:20:06 · 1533 阅读 · 0 评论 -
经典的机器学习方面源代码库
今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源转载 2013-03-26 20:40:54 · 888 阅读 · 0 评论