- 博客(3)
- 收藏
- 关注
原创 day4-房价信息
from lxml import etreeimport timeimport randomimport requests,csv#爬取链家网前10页嘉兴市二手房的房价#一开始是字典格式,想写进csv,这样好像不行。然后想换成列表,用pandas写进csv,但是也不行,不能解决列表覆盖原数据的问题,想了得有2个小时#搞不定,只能用原来的方法,如果有人知道怎么改,还请教一下。class LianjiaSpider(object): def __init__(self): self..
2021-12-19 20:04:26
188
原创 Day2-爬取豆瓣250
原本是爬取猫眼电影的,但是爬不到数据,怀疑跟要验证图片有关,临时换成豆瓣250#豆瓣250import requests,time,randomimport requestsimport reimport csvclass maoyan_film(object):#定义一个类 def __init__(self):#初始化实例,使得定义的变量可以通用 self.url = 'https://movie.douban.com/top250?s
2021-12-06 18:05:38
542
原创 爬虫day1
#运用面向对象编写贴吧数据import requests,time,randomimport csvimport requestsimport refrom lxml import etreeclass baiduspider(object):#定义一个类 def __init__(self):#初始化实例,使得定义的变量可以通用 self.url = 'https://tieba.baidu.com/f?kw={}&pn={}' .
2021-12-03 16:27:17
420
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人