
爬虫练习
在学爬虫,记录一下。
通信学生一枚
never say never !
展开
-
爬虫小小实战——豆瓣电影top250
这就是豆瓣电影top250的首页,本次小小实战就是将电影名、年代、评分以及评分人数存到csv文件中以便进行后续的数据分析。一、基础先贴代码及结果import reimport requestsurl="https://movie.douban.com/top250" #豆瓣top250的网址headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l...原创 2021-11-16 20:25:43 · 1051 阅读 · 2 评论 -
练习正则表达式之惰性匹配和贪婪匹配
.*称为贪婪匹配;.*?称为惰性匹配。下面举例说明:文本:玩会游戏吧,玩啥游戏?玩王者荣耀游戏。1、表达式:玩会.*游戏2、表达式:玩会.*?游戏文本:<div>java</div><span>python</div>1、表达式:<div>.*</div>2、表达式:<div>.*?</div>总结:惰性匹配就是寻找与目标最近的,就如第一个例子所示,文本..原创 2021-11-12 16:49:47 · 3141 阅读 · 0 评论 -
练习正则表达式之re模块
一、finditerimport reit=re.finditer(r"\d+","我的电话是10086,我对象电话是10010")for i in it: print (i.group())#这里finditer是python中的迭代器,利用group函数输出结果。\d+就是取数字的正则表达式二、compileobj=re.compile("\d+")r=obj.finditer("我的电话是10000,我对象电话是10011")for it in r:...原创 2021-11-15 08:57:37 · 1076 阅读 · 0 评论