很早前入手了一本网络爬虫的书籍,叫《用Python写网络爬虫》,作者是 Richard Lawson, 李斌翻译,人民邮电出版社出版的书籍(封面如图)。
刚才大概翻了下,个人感觉不太适合纯新手,比较适合有一些Python基础并且对爬虫感兴趣的同学。下面是针对刚才看第一章的两个Python小模块进行的一个尝试,都是书中的内容,仅仅做个笔记。
机器环境:
python
本文是Richard Lawson所著《用Python写网络爬虫》一书的学习笔记,介绍了如何使用Builtwith模块识别网站所采用的技术,以及利用whois模块查找网站所有者。在Python 2.7.13环境下,通过pip安装这两个模块,并展示了它们的基本用法。Builtwith模块能揭示网站使用的Web框架和JavaScript库,而whois模块则能查询到域名属于哪个组织。
很早前入手了一本网络爬虫的书籍,叫《用Python写网络爬虫》,作者是 Richard Lawson, 李斌翻译,人民邮电出版社出版的书籍(封面如图)。
刚才大概翻了下,个人感觉不太适合纯新手,比较适合有一些Python基础并且对爬虫感兴趣的同学。下面是针对刚才看第一章的两个Python小模块进行的一个尝试,都是书中的内容,仅仅做个笔记。
python

被折叠的 条评论
为什么被折叠?