本文介绍了爬虫的环境搭建,一个简单的图片爬取例子,最后介绍两个常见的小错误,
AttributeError: ‘NoneType’ object has no attribute 'find
“requests.exceptions.InvalidSchema: No connection adapters were found for…”
什么是爬虫?
这是一篇解释的比较容易理解的博文。
从零学习爬虫,逃不开安装环境。
完成安装环境,下一步就是安装常用的爬虫包了,这里提到主要是这两个包,request 和 BeautifulSoup (美味的汤)
这两个包是比较常见的,也比较好用。
import requests
from bs4 import BeautifulSoup
这两个包都可以在Pycharm中直接下载。
File–>Setings–>Project Interpreter
点击加号,搜索添加包
这也是添加引用包的方法,当然手动添加也可以,这里就不说了。
安装环境打好后就可以开始编程了。
博主之前没有学过py,所以介绍的部分可能比较基础。
废话少说,直接上代码。