- 博客(1)
- 收藏
- 关注
原创 python--爬取优快云作者信息及文章
本次项目爬取的是优快云上作者的数据信息以及作者的文章,本次项目主要用到parsel、os、re、xlwt、requests、pdfkit等库。此次项目写了两个方面,分别为:爬取用户数据,爬取作者文章并且转化为pdf。 用户数据模块主要包括:原创数量,周排名,总排名,访问数,用户等级,积分,分数,收藏的文章数量。爬取作者文章模块:将HTML文章转化为pdf文件格式,便于阅读以及防止乱码,数据及丢失等情况。 下面是部分源码: 主要用到的模块: 获取作者文章部分源码...
2021-12-23 20:24:21
1521
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅