
爬虫
文章平均质量分 65
TQ2
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
多协程和队列,爬取时光网电视剧TOP100的数据(剧名、导演、主演和简介)
目录说明Codeget_movie_id.pyget_movie_url.pyget_movie_info.pyinfo2csv.pymain.py 说明 首先查看电视剧网页结构,发现所有电视剧都在下面位置: 从中我们并未发现电视剧的链接,于是我们打开几部电视剧发现网页url有没有什么规律。 发现信息在下面文件里: 打开它的Headers: url:http://front-gateway.mtime.com/library/movie/detail.api?tt=1617353592649&m原创 2021-04-02 17:02:33 · 3954 阅读 · 4 评论 -
Selenium模拟浏览器获取爬取QQ音乐歌词、评论等。
说明 请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词、流派、歌曲发行时间、评论条数、评论时间、评论点赞次数、评论内容具体(每一首歌的评论>=500条)。 如下图所示: 歌词、流派、歌曲发行时间、评论条数保存在: music_info.csv文件中。 评论时间、评论点赞次数、评论内容具体保存在: comments_info.csv文件中。 统计每首歌的每个评论点赞次数保存在: series.csv文件中。 请按照如下形式组织代码:原创 2021-04-01 20:58:24 · 2588 阅读 · 2 评论