用python自动爬取海贼王漫画推送kindle

最新推荐文章于 2022-12-05 17:35:19 发布

痴痴痴痴痴痴。

最新推荐文章于 2022-12-05 17:35:19 发布

阅读量546

点赞数

版权

本文介绍了如何使用Python自动化爬取网络上的海贼王漫画，并将其转换为PDF格式，通过邮件推送到Kindle设备。通过设置，漫画可以按章节整理，避免了手动下载和发送的麻烦。主要涉及网络爬虫、图片转PDF及邮件推送等技术。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

链接：

https://www.zhihu.com/question/34098079/answer/790127807

来源：知乎（作者已授权）

之前闲着无聊，想找个项目练练手，这时我看到正在压着泡面的kindle。

就你了，之前一直想在kindle上看漫画，可是想到又得下载资源还得发送到kindle，好麻烦，所以一直没有实现这个愿望，说干就干吧。

首先关于kindle推送的设置，可以参考下面链接设置。

https://jingyan.baidu.com/article/656db918c1f032e381249c16.html

kindle是支持 JPEG (.jpeg, .jpg)、PDF (.pdf)等图片格式的。

这里不推荐使用图片格式，因为漫画有多页，如果用图片推送的话，你会看到kindle上散乱着一堆的图片。

思路整理

1、把漫画下载到电脑

2、将下载好的一话漫画（15-19页）转换为一张pdf格式文件

3、通过邮件推送到kindle

4、定时爬取网站发现漫画更新，立即推送漫画

需要用到的模块挺多的，一共需要这几个模块。

第一、

从网上抓取漫画页　

具体哪个网站就不说了，低调。因为此网站为静态网页，结构较简单，所以爬取起来比较容易。

这个函数主要为抓取一话里海贼王的所有图片地址，放到pic_list列表里并返回。

第二、

获取PDF文件　

然后定义一个函数（传入图片地址，文件保存地址）用来下载图片，这里是将下载好的图片转化为PDF文件

第三、

通过邮件推送到kindle　

PDF文件生成完毕后，就可以通过smtplib邮件服务来推送漫画了。

QQ邮箱的服务器为：

mail_host = "http://smtp.qq.com"

mail_user = "邮箱地址"

mail_pass = "邮箱密码" # qq邮箱一般需要授权码

receivers = [占位] # 这里填上kindle的亚马逊邮箱地址码，可填多个接收邮箱

红色标记的就是kindle邮箱地址

下面贴上代码：

到这里主要功能都已写完，目前追到了最新最新951话，952话还没更新。

运行效果

获取全部源码，公众号后台回复海贼王

-END-

往期精彩



1、Python教你成为“蚂蚁森林排行榜”第一名

2、“一行代码实现 xx”类题目（带答案）

3、写出一手烂代码的19条准则