
python爬虫
言希0127
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
selenium安装问题 出现错误 message:connection refused
环境为ubuntu,浏览器为firefox。在python上运行,总是出现打开浏览器页面,然而打不开目标网页。在python下显示错误为:message:connection refused。各种百度然而没用解决。最后发现是geckodriver版本高,19.0以后的需要firefox的版本为55以上。于是更新firefox为最新版59。问题解决。firefox更新在ubuntu 上命令:sudo...原创 2018-05-08 20:48:23 · 3512 阅读 · 0 评论 -
爬虫 利用正则表达式爬取猫眼电影
# coding=utf-8 import requests import re import json from io import open #from multiprocessing import Pool from requests.exceptions import RequestException headers = {'User-Agent':'Mozilla/5.0 '} def ...原创 2018-04-20 22:35:49 · 386 阅读 · 0 评论 -
python 爬虫入门 爬取京东商品图片并保存
# coding=utf-8 import urllib2 from bs4 import BeautifulSoup import re import requests import urllib ''' <li class="gl-item" data-sku="1026202803" data-spu="1026202802" data-pid="1026202802"> &...原创 2018-04-20 22:28:35 · 4305 阅读 · 3 评论 -
python爬虫 利用Beautifuloup爬取豆瓣影评
#coding=utf-8 from bs4 import BeautifulSoup import re import urllib2 import xlwt import sys reload(sys) sys.setdefaultencoding('utf-8') #得到页面全部内容 def askURL(url): request = urllib2.Request(url)#发...原创 2018-05-04 19:50:11 · 1084 阅读 · 0 评论