Python爬虫练习(requests模块)
关注公众号“轻松学编程”了解更多。
一、使用正则表达式解析页面和提取数据
1、爬取动态数据(js格式)
爬取http://fund.eastmoney.com/fund.html
流程:
######a.分析页面
用浏览器打开链接,清空已加载的数据,点击下一页,可看到动态数据已被封装成js格式:
var db = {...}

######b.获取url

######c.获取响应
######d.使用正则表达式清洗数据
######e.转为二维列表
f.遍历
import