目录
4.3、海量日志数据,提取出某日访问百度次数最多的那个IP?
4.4、寻找热门查询,300万个查询字符串中统计最热门的10个查询?
4.4、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词?
4.5、海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10?
4.6、有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序?
4.7、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
4.9、上千万或上亿数据(有重复),统计其中出现次数最多的前N个数据?
4.10、一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请给出思想,给出时间复杂度分析?
4.11、一个文本文件,找出前10个经常出现的词,但这次文件比较长,说是上亿行或十亿行,总之无法一次读入内存,问最优解?
4.14、在2.5亿个整数中找出不重复的整数,注,内存不足以容纳这2.5亿个整数。
4.15、给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
致力于一个专栏将Java面试说的清清楚楚,从工作实践角度出发,尽量涵盖Java主流知识点,全面讲述Java面试题。
本篇讲述数据结构和算法,总共涵盖5个知识点,21道热点面试题。
1、数据结构基础
1.1、如何理解基础的数据结构?
避免孤立的学习知识点,要关联学习。比如实际应用当中,我们经常使用的是查找,排序以及增删改,这在我们的各种管理系统、数据库系统、操作系统等当中,十分常用,我们通过这个线索将知识点串联起来:
- 数组的下标寻址十分迅速,但计算机的内存是有限的,故数组的长度也是有限的,实际应用当中的数据往往十分庞大;而且无序数组的查找最坏情况需要遍历整个