
面试
文章平均质量分 64
bitzhuxb
这个作者很懒,什么都没留下…
展开
-
从海量日志中提取访问百度次数最多的IP
P地址最多有2^32=4G种取值可能,所以不能完全加载到内存中。可以考虑分而治之的策略,按照IP地址的hash(IP)%1024值,将海量日志存储到1024个小文件中。每个小文件最多包含4M个IP地址。对于每个小文件,可以构建一个IP作为key,出现次数作为value的hash_map,并记录当前出现次数最多的1个IP地址。有了1024个小文件中的出现次数最多的IP,我们就可以轻松得到转载 2012-03-20 10:27:58 · 758 阅读 · 0 评论 -
海量数据的处理方法
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 s 遍历文件a,对每个url求取 ,然后根据所取得的值将url分别存储到1000个小文件(记为 )中。这样每个小文件的大约转载 2012-03-21 10:51:59 · 580 阅读 · 0 评论 -
获取整数的最大值最小值的宏定义
获取整数的最大值最小值的宏定义在C/C++编程中时常需要使用整数的最大值最小值,通常这两个常用是跟平台和操作系统有关的,不同的平台会有不同的值,因此可移植的办法就是推荐使用库函数提供的常量定义。(1)类似的常量定义在limits.h和float.h头文件中,可以查看源文件获取类似常量的使用办法。在头文件中,整数的最值通常是这样的名字:INT_MAX, INT_MIN,直接使转载 2012-05-11 17:08:25 · 11408 阅读 · 0 评论 -
给定平面上的圆(圆心坐标和半径长度)和一个正方形(四个点的坐标)判断两者是否有交点。
题目重述(来自面试题):(初稿,未改错别字。)用最简单, 最快速的方法计算出下面这个圆形是否和正方形相交。3D坐标系 原点(0.0,0.0,0.0)圆形:半径r = 3.0圆心o = (*.*, 0.0, *.*)正方形:4个角坐标1:(*.*, 0.0, *.*)2:(*.*, 0.0, *.*)3:(*.*, 0.0, *.*)4:(*.*, 0原创 2013-03-06 12:22:29 · 5253 阅读 · 3 评论