系统设计六(百度笔试题,请大家讨论)

假设某个网站每天有超过10亿次的页面访问量,出于安全考虑,网站会记录访问客户端访问的ip地址和对应的时间。

如果现在已经记录了1000亿条数据,想统计一个指定时间段内的区域ip地址访问量。


那么这些数据应该按照何种方式来组织,才能尽快满足上面的统计需求呢?

设计完方案后,并指出该方案的优缺点,比如在什么情况下,可能会非常慢?


答:用B+树来组织,非叶子节点存储(某个时间点,页面访问量),叶子节点是访问的IP地址。这个方案

的优点是查询某个时间段内的IP访问量很快,但是要统计系统设计题某个IP的访问次数或是上次访问时间就不得不遍

历整个树的叶子节点。答:

或者可以建立二级索引,分别是时间和地点来建立索引。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值