有一个表维护的是热门词汇信息,表结构为(词汇,查看次数)。
例如:
旅游,7493923
买车,5939274
二手房,2047902
… …
数据量十分大,是以亿为单位的数量级。
现在要求最热门的N个词汇(1<=N<=1000),并写出程序。
个人觉得题目不够完整,比如数据结构是什么样的呀。当然也可以自己定义,但是想想1个小时内要完成4题,而这种题目又不是很容易马上写出代码来。能力有限,最后我写了算法的思路。
本文介绍了一个涉及大量热门词汇数据的查询场景,要求实现快速检索出最热门的N个词汇(1<=N<=1000)。面对以亿计的数据量,讨论了数据结构的选择及算法设计思路。
有一个表维护的是热门词汇信息,表结构为(词汇,查看次数)。
例如:
旅游,7493923
买车,5939274
二手房,2047902
… …
数据量十分大,是以亿为单位的数量级。
现在要求最热门的N个词汇(1<=N<=1000),并写出程序。
个人觉得题目不够完整,比如数据结构是什么样的呀。当然也可以自己定义,但是想想1个小时内要完成4题,而这种题目又不是很容易马上写出代码来。能力有限,最后我写了算法的思路。

被折叠的 条评论
为什么被折叠?