2020年1月23日,睡醒一觉,发现新型肺炎的影响正在以肉眼可见的速度扩散,已经放假的我只能宅在家里,不敢随便外出。实在闲得无聊,我便拿起了技术人的工具,利用python,用数据来简单分析一波新型肺炎的影响程度,同时,大人们对这次事件好像毫无畏惧,多次提醒出门要小心留意,结果大人们也只是敷衍回答:没事。所以,咱们用数据来说话,通过最近网上的热搜数据让家长们重视起来。
获取热搜数据
那需要的微博热搜历史数据在哪找?借助【热搜神器】网站,可以查找微博热搜历史记录。
如上图,打开【热搜神器】网站,F12进入Network查看Request URL,通过点击可以发现URL中只有timeid是变化的,所以就找到了所需要的URL,即url = 'https://www.eecso.com/test/weibo/apis/currentitems.php?timeid=' + str(time_id),而最新的timeid可以通过另一地址获取:https://www.eecso.com/test/weibo/apis/getlatest.php。在这里我使用了2020-01-01到2020-01-23 0点和12点两个时间点的time_id,遍历这个区间,通过requests即可获取2020年1月1日到最新日期的热搜数