文章目录
案例 13:斗图啦表情包爬取
原文参考链接:https://dream.blog.youkuaiyun.com/article/details/83020175
没想到在 2018 年,我就爬取了这个站点,现在打开这个网址竟然依旧可以访问。
测试代码,发现无问题,正常可用。不过我还是上传了一份到 codechina 中
案例 14:PDF 电子书下载
原文参考链接:https://dream.blog.youkuaiyun.com/article/details/83151879
当前爬取这个网站的时候,橡皮擦还在吐槽这是一个小清新网站,一点广告都没有,但在 3 年后的今天,这个网站消失了,果然盈利才是硬道理。
没办法,我怀着无比心动的心情,又找到了一个新的小清新站点。
免费技术书籍,这个就更加有趣了,都是技术人员阅读的书籍。
https://www.freetechbooks.com/topics,在爬取该网站的时候,由于对方服务器在国外,顾下载 PDF 时,存在部分问