1、两个很大的列表A,B(内存装不下),列表里面是字符串,如何找出A中包含B的所有字符串?要求优化,提示:搜索引擎。
2、给一个像手机键盘那样的数字和字符的对应关系,给你一串数字和一个词典,如何找出这串数字对应的字符的组合成的并且在词典中的所有单词?要求优化。
答:当时考虑了树结构存储
3、分块的大数据内存装不下,如何找出这些数据中出现频次最高的前1000个?
答:用哈希来分桶,把所有相同的数据放在一个分块中,再统计。
4、两个已经排好序(升序)的数组找这个两个数组所组成的数组对应的中位数,要求复杂度小于O(m+n)。
答:两个指针,一开始都分别指向两个数组的中位数,然后比较,大的指针左移,小的指针右移,在两个指针所指向的数字大小关系互换的临界点就可以确定中位数了。
面试题总结-阿里神马和通联数据(算法)
大数据与算法挑战
最新推荐文章于 2019-11-26 23:12:25 发布
本文探讨了在内存限制条件下处理大规模数据集的有效算法和技术。包括如何查找列表A中包含列表B的所有字符串、通过数字键盘组合匹配词典中的单词、确定大数据集中频次最高的前1000个数据项以及寻找两个有序数组的中位数。
1万+

被折叠的 条评论
为什么被折叠?



