
爬虫
文章平均质量分 55
独行特立喵
这个作者很懒,什么都没留下…
展开
-
scrapy传递item
def parse(self, response): # collect `item_urls` for item_url in item_urls: yield Request(url=item_url, callback=self.parse_item) def parse_item(self, response):转载 2017-10-20 00:42:47 · 1004 阅读 · 0 评论 -
webdriver保存验证码截图
element = wait.until ( EC.visibility_of_element_located((By.CSS_SELECTOR,'.quc-main .quc-field-captcha img'))) #获取验证码browser.save_screenshot('screenshot.png')left = element.location['x']原创 2017-10-18 23:32:39 · 1212 阅读 · 0 评论 -
webdriver.chrome()禁止加载图片
from selenium import wendriverchrome_options = webdriver.ChromeOptions()prefs = {"profile.managed_default_content_settings.images": 2}chrome_options.add_experimental_option("prefs", prefs)browser转载 2017-10-18 21:31:58 · 13236 阅读 · 0 评论 -
Beautiful学习笔记
```pythonfrom bs4 import BeautifulSoup```# # 标签选择总结:获取tag时,总是获取第一个,若返回结果只有一个,则直接返回元素,若结果有多个,以迭代器返回,通过enumerate返回,两个标签之间若有换行,则有一个"\n "标签# 标签选择器### 选择元素(只返回第一个匹配标签)```pythonhtml = """原创 2017-10-08 16:52:54 · 310 阅读 · 0 评论 -
Fiddler使用,http原理
Fiddler的基本介绍 Fiddler的官方网站: www.fiddler2.com Fiddler的官方帮助:http://docs.telerik.com/fiddler/knowledgebase/quickexec Fiddler官方网站提供了大量的帮助文档和视频教程, 这是学习Fiddler的最好资料。 Fiddler是最强大最好用的Web调试工具转载 2017-11-07 13:29:51 · 857 阅读 · 0 评论 -
selenium.webdriver中添加代理
Firefox中设置代理ip method_1 from selenium import webdriver profile = webdriver.FirefoxProfile() profile.set_preference(‘network.proxy.type’, 1) profile.set_preference(‘network.proxy.http’, ‘127.0.0.转载 2017-10-26 00:14:38 · 3150 阅读 · 1 评论