一道关于热门关键词的面试题

本文介绍了一种数据结构的设计思路,用于统计用户输入的关键词热度,并筛选出最热门的关键词。该方案考虑了高频词汇的实时更新及干扰词过滤,适用于搜索引擎等场景。
有一查询窗口(比如google),用户每天会输入很多关键词(假定已中文分词),试设计一数据结构(Java),统计一下今天(或一个月)的前10个最热的热门关键词(去掉干扰词:,sex,郁闷,无法,为什么...),并分析其效率。
备注:干扰词可自由添加,用户输入词语不限。不能使用数据库。
用户前后输入关键词50或500000个:
举例:
memcached使用
Android
java安全
yahoo
sex
baidu
火箭
姚明
易建联
创业
楚留香传奇
放假通知
过年是那一天
ruby缓存
hibernate适用性
......
spring
(建议JavaEye也提供这一功能,统计出热门搜索关键词)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值