索引优先队列

最新推荐文章于 2024-08-19 20:58:51 发布

原创最新推荐文章于 2024-08-19 20:58:51 发布 · 1.9k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Algorithm 专栏收录该内容

7 篇文章

订阅专栏

本文介绍了一种在内存有限条件下统计广告投放展示与点击次数的算法。通过使用词典存储和时间队列的方式，实现了对大量广告日志的有效处理。该方法能够确保即使在高并发环境下也能准确记录广告的展示及点击情况。

一次广告投放会话（session）中，服务器会分别打印推送日志（push）、展示日志(show)（如果广告成功展示）和点击日志(click)（如果广告被点击），一次广告会话由唯一id标记，一个广告可能被点击多次，也可能不被点击。由于广告服务器的并发处理，同一id对应的推送日志，展示日志，点击日志可能不会按照原本的顺序出现（原本顺序指先推送后展示最后点击）。设计算法在内存有限的情况下，统计每一次广告投放的展示与点击次数。约定：展示日志和点击日志的时间差不超过10分钟，广告推送后20分钟后产生的点击视为无效不计入点击次数。

考虑到需要对推送日志、展示日志、和点击日志按id进行匹配，可以采用词典存储，由于日志很多，不能都存入词典，可以采用时间队列将推送时间已超过当前时间20分钟的日志从词典中剔除，并输出展示与点击次数。

具体可以采用词典{id：(push, show, click)}和有限队列<push.time, id>来实现。

Code

class IndexedPriorityQueue:

def __init__(self):

self.container = {}

self.queue = []

def top(self):

if len(self.queue) <= 0:

raise IndexError("Queue is EmptyNow!")

key_index = self.queue[0][1]

return self.container[key_index]

def top_key(self):

if len(self.queue) <= 0:

raise IndexError("Queue is EmptyNow!")

return self.queue[0]

def pop(self):

if len(self.queue) <= 0:

raise IndexError("Queue is EmptyNow!")

_, index_key = heapq.heappop(self.queue)

e = self.container[index_key]

del self.container[index_key]

return e

def push(self, e, index_key, queue_key):

if index_key in self.container:

raise IndexError("Duplicated keyserror!")

heapq.heappush(self.queue, (queue_key,index_key))

self.container[index_key] = e

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。