
【python】
文章平均质量分 51
sunshine0625
只要每天不在原地,就好
展开
-
python正则表达式(关于re)
Python的正则表达式import re一、匹配单个字符.(匹配任意字符除了\n) ma=re.match(r'{.}','a') ma.group() ---结果为:a ma=re.match(r'{...}','abc') ma.group() ---结果为:abc[...](原创 2016-03-29 18:55:23 · 484 阅读 · 0 评论 -
python爬虫之抓取网页中的图片到本地
最近开始学习python,python的爬虫诱惑力实在太强。今天看着网上的教程,也学会了这样一个小功能主要步骤是:1.抓取网页2.获取图片地址3.抓取图片内容并保存到本地下面是关键代码:import urllib.requestreq=urllib.request.urlopen('http://www.imooc.com/course/list')bu原创 2016-03-26 20:02:29 · 15553 阅读 · 7 评论 -
python编码问题——解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX
python实现爬虫遇到编码问题:error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX解决办法:改变标准输出添加代码:sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默原创 2016-12-22 14:59:53 · 27210 阅读 · 4 评论 -
window7 python 安装 lxml
window7安装lxml1.pip install wheel2.查看当前python环境支持的安装包文件1.输入python2.import pip;print(pip.pep425tags.get_supported())3.显示支持版本4.xml官网下载对应版本安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml原创 2016-12-22 16:25:17 · 454 阅读 · 0 评论 -
python 爬虫
爬虫之抓取糗事百科的段子(python3.5环境):1.下载页面2.解析(xpath方法)# -*-coding:utf-8 -*-import urllib.requestimport sysimport iofrom lxml import etreefrom urllib.parse import urljoinsys.stdout = io.TextIOWrappe原创 2016-12-22 19:31:40 · 577 阅读 · 0 评论