
海量数据处理
onlyonename
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
程序员编程艺术:第十章、如何给10^7个数据量的磁盘文件排序
转自:http://blog.youkuaiyun.com/v_july_v/article/details/6451990 前奏 经过几天的痛苦沉思,最终决定,把原程序员面试题狂想曲系列正式更名为程序员编程艺术系列,同时,狂想曲创作组更名为编程艺术室。之所以要改名,我们考虑到三点:1、为面试服务不能成为我们最终或最主要的目的,2、我更愿把解答一道道面试题,ACM题等各类程序设计题目的过程转载 2011-12-17 12:43:52 · 924 阅读 · 0 评论 -
十道海量数据处理面试题与十个方法大总结
转自:http://blog.youkuaiyun.com/v_JULY_v/article/details/6279498 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整转载 2011-12-17 20:55:13 · 546 阅读 · 0 评论 -
教你如何迅速秒杀掉:99%的海量数据处理面试题
转自:http://blog.youkuaiyun.com/v_july_v/article/details/7382693 前言 一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,:-),同时,此文可以看做是对这篇文章:十道海量数据处理面试题与十个方法大总结的一般抽象性总结转载 2012-03-24 18:58:13 · 609 阅读 · 0 评论 -
海量数据面试题整理
转自:http://blog.youkuaiyun.com/hexinuaa/article/details/6637385 海量数据面试题整理 1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处转载 2013-07-15 23:08:43 · 632 阅读 · 0 评论 -
IT名企面试系列之腾讯笔试题
转自:http://jingyan.baidu.com/article/2d5afd69b7b5f785a2e28eb0.html 这里,我给大家分享篇笔试题,大家来看看自己会做几道啊,如果都会的话,恭喜你,赶快去面试吧。。。。。。。 问题 1 买200返100优惠券,实际上折扣是多少? 2转载 2013-09-07 16:56:32 · 1060 阅读 · 0 评论