
web
文章平均质量分 93
凤凰传奇的粉丝
这个作者很懒,什么都没留下…
展开
-
自动刷新订火车票
学习了webdriver定位的相关知识,splinter和selenium都可以实现,语法略有不同。 在选择始发站,目的地和时间的时候,需要把cookie添加到指定位置。 使用sleep(3)可以使程序暂停几秒钟,防止网络延迟导致程序执行出错。from splinter.browser import Browserfrom time import sleepclass Buy_Tic...转载 2017-12-17 01:07:52 · 392 阅读 · 0 评论 -
我要爬爬虫(2)-实例化处理器,代理及cookie
实例化处理器 当我们请求一个带有弹出窗口验证的网页,例如http://httpbin.org/basic-auth/user/passwd HTTPPasswordMgrWithDefaultRealm函数可以加入用户名和密码信息。 使用HTTPBasicAuthHandler函数实例化处理器。 使用build_opener函数可以实例化一个opener,是上节学习的urlopen...原创 2018-05-15 06:05:02 · 465 阅读 · 1 评论 -
我要爬爬虫(5)-正则表达式
正则之前就学过,也用过,这里再过一遍吧~ python中主要使用re模块操作正则。 正则表达式测试工具http://tool.oschina.net/regex/,直接把文本转成正则。常用规则\w 字母,数字,下划线\W 非\w\s 空\S 非空\d 数字\D 非数字\n 换行^ 字符串开头. 任意非换行字符* 匹配0个或多个表达式+ 匹配一个或多个表达式? 非贪...原创 2018-06-07 01:39:23 · 200 阅读 · 0 评论 -
我要爬爬虫(4)-初识requests模块
与urllib模块不同,requests模块发送请求可以用明确定义的函数实现,如: requests.get() requests.post() 不需要urlopen()和handler(),更加方便发送请求。import requests,jsondata={ 'name':'Tom', 'age':1}re=requests.get('http://httpbi...原创 2018-05-31 22:58:38 · 747 阅读 · 0 评论