
interview baby
unwrittenkeys
这个作者很懒,什么都没留下…
展开
-
设计数据访问策略
百度的面试题一道: 在处理磁盘数据时,需要首先将其读入内存才能进行处理。如果要读取的数据已经在内存中,则可以直接访问内存。通常来说内存是有限的,因此要读取新的数据时必须覆盖内存中一部分原有的数据。假设现在有n块同样大小的数据,内存一共可以容纳m块数据。现在给出一系列对这些数据的读取请求,要求它们必须按照给定的顺序被读取,同时要求读取磁盘的次数尽可能地少。请简述一个策略满足这样的要求。 ...原创 2012-03-20 22:43:21 · 189 阅读 · 0 评论 -
海量数据处理中的hash单调问题
参加百度的面试,面试官提了一个海量数据问题,貌似自己的回答没能让人家满意,纠结点是: 大规模数据一般先用hash来分为小的数据段,然后在内存里处理之,然而如果hash后hash值还是各不相同(及其变态的情况),怎么办? 回来思考了下,下面是自己的想法,大家说说看: 如果一遍hash后,数据还是十分单调,可以采用另一个hash函数,或者不是单纯按照hash值分类,而是按照...原创 2012-03-21 19:58:52 · 121 阅读 · 0 评论 -
网络传输或写磁盘struct问题
写磁盘时应该注意: (引自短歌老大)直接fwrite并非不可以,只是可移植性太差。一般我们把数据写入文件都是为了进行数据交换,而直接把一个结构体用一次fwrite调用写入文件后是否可以再用一次fread正确读出取决于写入代码和读出代码编译时的字长、对齐逻辑和字节序等问题(这句话长点,大家凑合着看),严重影响可移植性。 把一个结构体写入文件时我觉得要注意以下几点: 1:要按不同域分别写入...原创 2012-03-22 10:21:25 · 98 阅读 · 0 评论 -
被译文骗了个球的题目
看到一道题目,开始挺昏沉,加上翻译是在碉堡,没理解,后来大悟,这个题目编程之美上有嘛,就是个位操作统计个数的问题,easy: 一个数组A[1,n]能容纳n个数字,现将0到n这n+1个数字,随机的放入到数组中。最后会有一个数字没有进入数组。现在让你找出这个数字。但是有如下的限制,不能直接访问数组的整个元素,只能访问“A[i]的第j位”。写出代码找出该元素。能否将时间复杂度控制在O(n)。 ...原创 2012-03-26 19:33:18 · 88 阅读 · 0 评论