pixiv自动下载器
以前没有学爬虫的时候,在pixiv上看到喜欢的画师作品都要一张一张的保存,效率十分低下,还不好管理作品,也无法实时获取画师的最新作品
所以实现了一个自动下载器,它有以下功能
- 根据用户关注的画师获取画师所有的插画以及gif作品
- 按照指定位置以 根目录 => 画师 => 作品集 => 作品 的目录格式整齐存放作品
- 可以根据目录下载信息,下载未下载的作品,即作品的补充也无需其他顾虑
- 爬虫安全不会被检测和封号,但是也保存了用户关注画师列表以防封号后用户信息丢失
- 更多精彩正在补充中
代码位置:
https://gitee.com/xiaoxin_jia/pixiv_download.git
(有更多问题可以随时问我,如果觉得不错的话记得点赞收藏)
如何运行
-
搭建python环境,下载所需要的依赖
-
参数传入
在config.yaml文件中填入参数
user_id 用户唯一标识(必须填入,可以自己登录pixiv之后在个人主页的url上查看)
download_path 本地下载地址(必须填入)
cookie 登录cookie(必须填入,需要传入自己登录pixiv之后的cookie,需要自己先手动登录一次)
limited_time 每个画师下载时间,默认为5分钟(必须填入,超过时间开始下一个画师作品的下载,如果想下完一个画师再下载另一个画师的作品,可以把这个参数调到1000)
start_following 开始下载的画师名字(可不传入这个参数,将会按关注列表顺序下载,传入则从这个画师开始顺序下载)
如何获取user_id
登录pixiv之后点击头像进入个人页面
如果没有显示图片则再readImage里面查看image-1.png
如何获取cookie
登录pixiv之后随便访问一个插画作品
如果没有显示图片则再readImage里面查看image-2.png