
智力考场
文章平均质量分 78
犀利的蛙
安安
展开
-
猜牌游戏
S先生、P先生、Q先生他们知道桌子的抽屉里有16张扑克牌:红桃A、Q、4 黑桃J、8、4、2、7、3 草花K、Q、5、4、6 方块A、5。约翰教授从这16张牌中挑出一张牌来,并把这张牌的点数告诉 P先生,把这张牌的花色告诉Q先生。这时,约翰教授问P先生和Q 先生:你们能从已知的点数或花色中推知这张牌是什么牌吗? 分析:红桃A、Q、4 黑桃J、8、4、2、7、3 草花K、Q、5、4、6...原创 2013-04-11 23:33:09 · 1075 阅读 · 0 评论 -
求相邻数的和等于这个数值的全部数
今天群里问了一个面试题,这里记录一下,欢迎指点,提出更优方案: 题目:输入一个数值,求出这个数值所包含的相邻数的和等于这个数值的全部数,并且全部输出 例:输入数 15输出:15=1+2+3+4+5 15=4+5+6 15=7+8 求思路 public static void countNum( int num){ in...2013-07-15 20:36:12 · 659 阅读 · 0 评论 -
百度一道面试题
那天看朋友提了一个百度面试的题目:怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话,当然顺序是不一定的,很多拿到题目第一反应就是用map,当然可以解决,但是效率不高。 还有人觉得应该用算法xxx,我是没想到用啥算法好...! 还有觉得应该先排序... 还有觉得用位图....bitmap 等等方法! ...2014-05-21 11:43:00 · 155 阅读 · 0 评论 -
大数据url 去除重复
前天接到电话面试,有一个url 去除重复的问题,场景大概是:公司获取了大量url,肯定是超过内存了,按行存放,现在目的想剔除重复的数据比如:一个5G 的txt 文件,url 一行一行的存放,而我们的内存只限制1G 我当时首先考虑分拆文件,然后hash,然后想排序比较,当时没想到好的办法,这里先说第一种: 方案一:1.拆分文件,A B C D E, 条件:...原创 2014-01-19 23:33:32 · 1442 阅读 · 0 评论 -
大数据去除重复--实战(一)
最近快过年了,来了一个紧急任务,加班加点的一周,终于上线了。也没多少时间去研究出去重复数据的算法,上一篇文章的算法,理论是可以的!但是由于我采用的行迭代的方式,JVM 会出现栈的深度溢出,我就换了一种方式,这里再次介绍给大家: 回顾一下题目:超过内存限制的URL,去除重复数据! 我的方法是根据hashCode 范围进行分...原创 2014-01-25 13:09:15 · 3657 阅读 · 1 评论 -
大数据去除重复--实战(二)
关于上一篇数据去重复的问题,在结尾的时候提到,另一种思路:在url-->hashCode 根据范围写入文件的时候,不用迭代二分法,采用平均算法,也就是说根据url的大概行数,设置一个单位区间,循环遍历行的时候,根据hashCode 值,放入不同的空间,然后再放入内存去除重复,写入汇总文件。 去个例子,我文件数据2G,1.5亿行,自己设定一个区间...原创 2014-01-28 15:10:50 · 835 阅读 · 0 评论 -
大数据高频词算法实战(一)
一、序言 我们群里发了了一个挑战,题目大概是:2亿随即字符串,在一个txt 文本里面,找出出现频率最高的前100 个字符串,双核CPU,4G 内存,当然JVM 只开了1G。 其实类似的题目,很多公司也都有了,但是可能思想说得多,实战稍微少点,这里我抽空也写了一种通用的,凡是上诉题目都可以按方法进行处理,也做可以做其他扩展和优化。 二、设计原理...2014-03-30 19:49:20 · 909 阅读 · 0 评论