Python爬虫:爬虫基础and粗鲁地爬取一个网页
今天我们要学习的内容是轻量级的爬虫,即我们所抓取的页面是静态加载的网页内容,而不是那些需要用户登录或者JavaScript异步加载的网页内容。首先我们明确一个问题:爬虫能干什么?爬虫:一段自动抓取互联网信息的程序我们可以把互联网看成URL组成的网状结构,就像下图一样:我们通过手工的方式来访问其中的部分URL,当我们有访问很多的具有某一方面的相同特征的网页需要,手工的方式效率就太...
原创
2018-07-22 11:01:29 ·
508 阅读 ·
0 评论