
爬虫
birthpla
这个作者很懒,什么都没留下…
展开
-
python爬取喜马拉雅音频,突破xm-sign校验反爬(爬虫)
目录一、python执行js代码生成xm-sign1.1获取喜马拉雅服务器时间戳1.2生成xm-sign二、根据需要爬取的专辑Id获取音频链接三、爬取音频并保存四、测试好久没写博客了,写个玩玩一、python执行js代码生成xm-sign1.1获取喜马拉雅服务器时间戳js生成xm-sign的函数需要用到这个时间戳,直接上代码啦'''爬取喜马拉雅服务器系...原创 2019-05-18 11:06:46 · 6649 阅读 · 11 评论 -
自动获取cookie,爬取新浪微博热门评论
目录一、前言二、代码一、前言前几天突然想爬一爬微博的热门评论玩,就间断地挤出来了一点时间写了一个简略版。最大的难点是新浪的访客机制,导致无法直接用requests爬取,需要先在cookie上下功夫,但是又不想花太多时间去破解,于是决定用selenium先模拟一下,获取cookie之后再通过requests爬取。程序已打包成exe,需要的同学可以下载体验,压缩包内有运行...原创 2019-07-13 23:34:31 · 847 阅读 · 0 评论