简介
围绕 Python 爬虫展开,包括四个章节。第一章从 Python 爬虫入门,涵盖爬虫概念、Requests 爬取、Xpath 解析、数据保存及入库等知识,并结合知乎、豆瓣、淘宝等案例讲解浏览器抓包及 Selenium 爬取动态网页。第二章介绍 Scrapy 框架,包括安装、基本使用、选择器、项目管道、中间件及 Request 和 Response 等内容。第三章是爬虫进阶操作,涉及网络抓包分析与数据入库去重。第四章聚焦分布式爬虫及实训项目,如 58 同城、去哪儿网、京东数据抓取等。
资源
目录
├── 第1章Python爬虫入门
│ ├── 1-6浏览器抓包及headers设置(案例一:抓取知乎).mp4
│ ├── 1-8使用自动化神器Selenium爬取动态网页(案例三:爬取淘宝).mp4
│ ├── 1-4使用Xpath解析豆瓣短评.mp4
│ ├── 1-7数据入库及MongoDB(案例二:爬取拉勾).mp4
│ ├── 1-5使用pandas保存豆瓣短评数据.mp4
│ ├── 1-1什么是爬虫.mp4
│ ├── 1-3使用Requests爬取豆瓣短评.mp4
│ ├── 1-2初识Python爬虫.mp4
│ ├── 获取更多资源-众拾乐享-www.zhongshiwl.cn.html
│ ├── 1-8使用自动化神器Selenium爬取动态网页(案例三:爬取淘宝商品).html
│ ├── 1-6浏览器抓包及headers设置(案