
网络爬虫
data_scientist
数据科学家
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python通过本地保存的cookie文件实现登录并访问相关网页
#_*_ coding:UTF-8 _*_import cookielibimport urllib2import sysreload(sys)sys.setdefaultencoding('utf-8')cookie=cookielib.MozillaCookieJar()cookie.load('cookie.txt',ignore_expires=True,ignore_disca原创 2016-06-13 10:43:09 · 5846 阅读 · 2 评论 -
python以post方式登录csdn网站,并以cookie方式访问个人信息
-- coding: utf-8 --import sys import urllib,urllib2 from scrapy.selector import Selector import cookielib import hashlib reload(sys) sys.setdefaultencoding(‘utf-8’)url=’https://passport.youkuaiyun.com原创 2016-06-13 10:35:19 · 1074 阅读 · 0 评论 -
Python读取谷歌(google)浏览器cookie并实现登录
以下代码实现使用谷歌浏览器的cookie登录京东网站并获取订单列表# -*- coding:'utf-8' -*-import sqlite3import cookielibimport urllib2import os,sysimport win32cryptdef build_opener_with_chrome_cookies(domain=None): cookie_fil原创 2017-01-23 16:15:56 · 10376 阅读 · 0 评论 -
爬虫时保持cookies一直有效的方法
# -*- coding: utf-8 -*-"""加载cookies文件,使用requests库爬取数据并动态更新cookies,可以使cookies不失效"""import pickleimport timeimport requestsimport randomclass Spider: def __init__(self,domain='51job.com'):原创 2017-07-17 10:17:17 · 25018 阅读 · 1 评论 -
通过模拟浏览器获取cookies
def set_login_params_Job51(self): """ 51Job登录配置 2017-06-06 17:36 由于51Job的验证码是中文,所以这里仅仅采用chromeDriver打开Chrome浏览器, 自行在页面输入用户密码进行验证(60s内输入用户密码和验证码),然后程序通过定期访问页面来保持页原创 2017-07-17 10:23:53 · 2343 阅读 · 0 评论 -
通过cookielib获取cookies
适用于没有验证码登录,直接post参数登录的方式# -*- coding: utf-8 -*-import timeimport randomimport pickleimport cookielibimport osimport urllib2,urllibfrom selenium import webdriverimport sysreload(sys)sys.setdefa原创 2017-07-17 10:28:44 · 1589 阅读 · 0 评论