
python
gxk1992
这个作者很懒,什么都没留下…
展开
-
python 爬虫
request => response =>html json等解析 => 保存指定格式 自动模拟selenium&&webdriver || splash || PyV8、Ghost.py 保存数据:纯文本||关系型数据库||非关系型数据库||二进制文件 HTTP请求测试网站http://httpbin.org/from selenium import webdriverdrive原创 2018-01-24 11:20:59 · 215 阅读 · 0 评论 -
selenium&&pyquery&&pymongo
search.pyfrom selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWai原创 2018-01-27 19:52:10 · 317 阅读 · 0 评论 -
python3代理爬虫
抓取索引页内容这里写代码片代理设置这里写代码片分析详情页内容这里写代码片将数据保存到数据库完整代码import requestsfrom urllib.parse import urlencodefrom pyquery import PyQuery as pqfrom setting import *import pymy原创 2018-01-28 10:27:35 · 672 阅读 · 0 评论 -
Python Scrap安装
wheellxml (http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)PyOpenssl(https://pypi.python.org/pypi/pyOpenSSL#downloads)Twisted(http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted)Pywen32(https://sou原创 2018-01-29 10:19:45 · 1040 阅读 · 0 评论