内容提要:
数据爬取
数据解析
数据存入MySQL数据库
一、数据爬取
爬取的网页:https://movie.douban.com/top250
爬虫基本原理:
1.模拟http请求,请求发送到目标网址
a urllib.request openurl(url)
b Requests 定制header 反爬虫
2.获取html
3数据解析----从海量数据中提取我们需要的部分
4数据存储-----存储到文件,打印输出,数据库
内容提要:
数据爬取
数据解析
数据存入MySQL数据库
一、数据爬取
爬取的网页:https://movie.douban.com/top250
爬虫基本原理:
1.模拟http请求,请求发送到目标网址
a urllib.request openurl(url)
b Requests 定制header 反爬虫
2.获取html
3数据解析----从海量数据中提取我们需要的部分
4数据存储-----存储到文件,打印输出,数据库